音视频基础_3_音频压缩技术简介
⾳视频基础_3_⾳频压缩技术简介
⾳频压缩技术简介
压缩/编码技术与格式之间的关系
由于原始⾳频数据(PCM数据)体积很⼤,不利于存储和传输,所以需要压缩。压缩技术也被称为编码技术(Encode),⼆者基本上是同样的意思。编码技术有很多种,⽐如 MP3 技术,将 PCM 数据编码之后,会形成新的⽂件,⼀般来说使⽤哪种编码技术,⽣成的⽂件就被称为这种格式的⽂件,有对应的后缀名。例如 MP3 编码⽣成的⽂件就是 .mp3 ⽂件,反过来说,.mp3 ⽂件就是使⽤了 MP3 编码技术⽣成的⽂件。
⾳乐播放器在播放 .mp3 ⽂件时,需要按照⼀定的⽅式读取其中的数据,这个过程就叫做解压缩或解码(Decode)。⼀种编码技术必然包含对应的解码技术,就如同你可以使⽤压缩软件进⾏压缩,也可以⽤它进⾏解压缩。编解码合起来的英⽂单词是 Codec。
⽐特率(码率)
⽐特率(bitrate)也叫码率,是⾳视频当中⾮常重要的⼀个概念。⾳频的⽐特率是指将模拟声⾳信号转换成数字声⾳信号后,单位时间内的⼆进制数据量,单位是 bit/s 或bps,注意是⼩写的 b,即 bit。视频
的⽐特率我们后⾯讲到的时候会再说。
假设采样频率为44.1kHz,⽐特深度为 16,⽴体声双声道,这样录制的 PCM 原始⾳频的⽐特率为:44100 * 16 * 2 = 1411200 bps = 1411.2 Kbps。
PCM在录制的时候,⽐特率为 1411.2 Kbps,约 1.4 Mbps 每秒,那么在播放的时候,同样得是这个⽐特率,本地播放还好,但是如果是在线播放,带宽压⼒就很⼤了。以今天动不动就 100Mbps的带宽来看,这不是什么问题,但是当年的带宽可是只有现在的⼏⼗分之⼀甚⾄百分之⼀,所以必须压缩。
⽆损压缩和有损压缩
⾳频压缩技术有两种压缩⽅式,分别是有损压缩和⽆损压缩。常见到的 MP3、WMA 都是有损压缩,有损压缩会降低原始⾳频的采样频率和⽐特深度,并且会移除原始⾳频中不容易被⼈⽿听到的声⾳,例如极⾼频和极低频,以及被强低频遮蔽的⾼频声⾳等等。
另⼀种⾳频压缩被称为⽆损压缩,⽆损压缩能够在100%保存原始⾳频的所有数据的前提下,将⾳频⽂件的体积压缩的更⼩,⽽将压缩后的⾳频⽂件还原后,能够实现与源⽂件相同的⼤⼩、相同⽐特率。
⽆论有损压缩还是⽆所压缩,都使⽤了复杂的算法,将原始⾳频中的数据按照⼀定的格式重新组织,
以此来降低数据量,从⽽减⼩⽐特率。只不过有损压缩⽆法完全还原,⽽⽆法压缩可以完全还原。
歇后语包公断案常见的⽆损压缩有如下⼏种:
WAV:由微软和 IBM 联合设计,经过了多次修订,可⽤于Windows,MacOS,Linux等多种操作系统。标准的 WAV ⽂件和 CD 格式⼀样,也是 44.1KHz的采样频率,16 位量化深度,因此声⾳质量和 CD 相差⽆⼏。WAV的特点:真实记录⾃然声波形,基本⽆数据压缩,数据量⼤。其实 WAV 与其说是压缩格式,不如说是和 PCM 类似的原始⾳频格式,因为就没有压缩。
APE:⼀种⾳频⽆损压缩技术,在⾳质不降低的前提下,⼤⼩压缩到传统⽆损格式⽂件的⼀半。
FLAC:⼀套著名的⾃由开发的⾳频压缩编码技术,也是⽆损压缩。它不会破坏任何原有的⾳频信息,所以可以还原⾳乐光盘⾳质。
2012年以来它已被很多软件及硬件⾳频产品(如CD等)所⽀持。七年级下册地理期末试卷及答案
常见的有损压缩格式有:MP3,WMA,AAC,OGG。后⾯会更详细的介绍。
MPEG
MPEG(Moving Picture Experts Group,动态图像专家组)是ISO(International Standardization Organization,国际标准化组织)与IEC(International Electrotechnical Commission,国际电⼯委员会)于1988年成⽴的专门针对运动图像和语⾳压缩制定国际标准的组织。
祝福短信 中秋该专家组建于1988年,专门负责为 CD 建⽴视频和⾳频标准,⽽成员都是为视频、⾳频及系统领域的技术专家。后来,他们制定出MPEG-X 标准,令⾳视频传播⽅⾯进⼊了数字时代,现在⼤家说的指的 MPEG-X 版本,就是由 这个组织所制定⽽发布的视频、⾳频、数据的压缩标准。⼴为⼈知的 MP3,MP4,AAC,以及⼀些视频编码技术都和这些标准相关。
总之,研究⾳视频编解码技术,MPEG 是个绕不开的组织,后⾯还会多次提到。
MP3 压缩技术
MP3 全称是 Moving Picture Experts Group Audio Layer III,即 MPEG Audio Player3,简称为MP3。它被设计⽤来⼤幅度地降低⾳频数据量。MP3 压缩技术可以将⾳乐以1:10 甚⾄ 1:12 的压缩率压缩成容量较⼩的⽂件,⽽对于⼤多数⽤户来说,压缩后的⾳质与原始⾳频相⽐没有明显的下降。
MP3 利⽤⼈⽿对⾼频声⾳信号不敏感的特性,将 PCM 数据中的声⾳按照频率划分成多个频段,对不同的频段使⽤不同的压缩率,对⾼频加⼤压缩⽐(甚⾄忽略信号),对低频使⽤⼩压缩⽐,保证信号
不失真。这样⼀来就相当于抛弃⼈⽿基本听不到的⾼频声⾳,只保留能听到的低频部分,从⽽将声⾳⽤1:10甚⾄1:12的压缩率压缩。MP3 的⽐特率⼀般介于128kbps和320kbps之间,完全可以满⾜在线播放的需求。
⽤MP3形式存储的⾳乐就叫作MP3⾳乐,能播放MP3⾳乐的机器就叫作MP3播放器。在刚刚问世时,MP3 ⾮常流⾏,⽹上能下载到的⼤部分⾳乐都是 MP3 格式,MP3 播放器也⾮常流⾏,深受⾳乐爱好者的欢迎,在国内可以说是90后的集体回忆。然⽽随着新的压缩技术的出现,以及消费者转向智能⼿机等原因,现在 MP3 播放器已经慢慢消亡。
WMA 压缩技术
WMA(Windows Media Audio)是微软在互联⽹⾳视频领域的⼒作。WMA 格式是以减少数据流量但保持⾳质的⽅法来达到更⾼的压缩率⽬的 ,其压缩率可以达到1:18。
以前我们只要提到下载⾳乐,第⼀反应就是MP3,其实 MP3 已经不如当年流⾏,WMA 在压缩⽐和⾳质⽅⾯都超过了MP3,现在绝⼤多数在线⾳频试听⽹站都使⽤ WMA。
信用卡进度
只可惜 WMA 有两个缺点:⼀是当⽐特率⼩于128Kbps时,WMA ⼏乎在同级别的所有有损编码格式中表现得最出⾊,但是超过
128Kbps 后,⾳质提升就不⼤了;⼆是 WMA 标准不开放,完全掌握在微软⼿⾥。
什么汉堡加盟好世界语系AAC 压缩技术
AAC(Advanced Audio Coding),中⽂名:⾼级⾳频编码。出现于1997年,由Fraunhofer IIS、杜⽐实验室、AT&T、索尼、诺基亚等公司共同开发,⽬的是取代MP3格式。与MP3不同,它采⽤了全新的算法进⾏编码,更加⾼效,相对于 MP3,AAC格式的⾳质更佳,⽂件更⼩。
苹果的iPod和iPod mini都能播放16-320Kbps的AAC⽂件,在加上苹果倾⼒打造的iTunes⾳乐播放器,为AAC格式⽂件的传播提供了便利。之后多家公司跟进,AAC 现在是除了 MP3 和 WMA 之外最流⾏的⾳频格式。
总的来讲,AAC可以说是极为全⾯的编码⽅式,⾼码率下⾳质⾮常出⾊,低码率下也能保持不错的⾳质,⾮常适合移动通讯、⽹络电话、在线⼴播等领域,此外,AAC 经常⽤于视频中⾳频轨的编码。
Ogg
Ogg全称是OGG Vorbis, Ogg是完全免费、开放和没有专利限制的⾳频编码技术。OggVorbis⽂件的扩展名是".ogg"。Ogg⽂件格式可以不断地进⾏⼤⼩和⾳质的改良,⽽不影响旧有的编码器或播放器。
可惜 Ogg 出现得太迟了,在播放设备⽀持⽅⾯不如 MP3 和 AAC,在流媒体⽅⾯,WMA 已经是垄断地位,所以 Ogg ⼀直没有普及开来。
总结
我们介绍了⼀些⾳频压缩技术,简单说了下原理,但是没有介绍具体的算法。具体算法都很复杂,暂时不是我们研究的重点,以后有机会详细讲。
还是要注意⼀个关键的概念:⽐特率,即码率,后⾯我们在视频部分还会遇到⽐特率的概念。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。