音视频的格式发展趋势

随着当前计算机技术日新月异的发展趋势,人们之间通过音视频进行通话,通过手机端、PC端观看视频,这样不断有新的音视频编码格式与标准出现。国内领先的音视频开发“AnyChat”产品,是一款专注于音视频的解决方案,他们采用的音视频编解码是目前最为流行的H.264视频编解码技术和AAC音频编解码技术,有兴趣朋友可以进行搜索进行测试试用。现在4K视频越来越火热,下面结合目前流行的音视频编码格式与码率计算做一些简介,介绍电脑上常见的音频格式 。

  (1)PCM编码格式(WAV格式):PCM脉冲编码调制是Pulse Code Modulation的缩写,要算一个PCM音频流的码率是一件很轻松的事情,采样率值采样大小值等于声道数与采样率与采样大小的乘积。一个采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1×16×2=1411.2 kbps。我们常说128K的MP3,对应的WAV参数,就是这个1411.2kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M。 由此可知,一个小时的CD格式的音乐需要635MB的存贮空间,一张普通CD片最长的播放时间为74分钟。

  (2)MP1、MP2、MP3格式:MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1。在128kbps的采样频率下编码一首时长1分钟的歌曲,可以得到960KB的MP3文件。采用缺省的CBR(固定采样频率)技术可以以固定的频率采样一首歌曲,而VBR(可变采样频率)则可以在音乐“忙”的时候加大采样频率以获取更高的音质,不过产生的MP3文件在某些播放器上可能无法播放。我们把VBR的音质级别设定成与前面的CBR文件基本一样,生成的VBRMP3文件为990KB。目前网上的MP3大多采用128kbps的采样频率,所以我们可以按MP3文件大小来判断一首歌的长短,如MP3文件大小是3M,那么在采样频率为128kbps情况时,歌曲的时间约为3分钟;或MP3文件大小是4.5M,歌曲的时间约为3分钟,那么我们可以知道这首歌的采样频率为192kbps。一首歌文件越大,采样频率越高,音质就会越好。

   (3)WMA格式:WMA就是Windows Media Audio的缩写,使用微软自己开发的Windows Media Audio技术,这是一种音频压缩格式。WMA是Microsoft Windows Media技术中的一部分,它包含了对音频格式的一个完整的定义,包括编码规范和加密格式。它的加密格式异常强大,甚至可以限制播放机器、播放次数以及播放时间,有着比MP3更好的版权保护性能。还有就是WMA的“流”性能要比MP3好,在音质不高的情况下,相同质量的WMA的流量要比MP3低,微软声称,在只有64kbps码率的情况下,WMA可以达到接近CD的音质。根据相关测评,WMA的最佳码率为64~192kbps,如不在此范围内其音质反而不如相同码率的MP3。AnyChat音视频开发中的录像存储格式就可以采用该格式进行存储。

   (4)MIDI格式:MIDI即电子琴声音,它并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。这样,一个MIDI文件每存1分钟的音乐只用大约5~10KB存贮空间。由于文件小,所以适用于在存储空间不大的手机上做和弦铃声。

   (5)DTS、AC-3格式:家庭影院一共有六个音箱,分别是前置左右音箱、后置左右环绕音箱,用来营造身临其景的环绕声场;一个中置音箱,用来强化影片中的对白;还必须配置一个超重低音箱,以感受排山倒海的气势。与音响组合不同的是,家庭影院可以营造出一种身临其境的感觉,这是因为家庭影院具有环绕处理效果。我们下面介绍一下环绕声场5.1多声道系统的两个代表DTS、AC-3的数据情况。采用PCM编码的两声道的CD数据率为2RFs,即1.411Mb/s。使用多声道系统时,左、右、后置左右环绕、及中置音箱各占一个声道的数据,超重低音由于只要表现低音部分而不需要太高的采样所以只占0.1声道的数据,此时的数据率为 5.1×R×Fs=3.598Mb/s。

  DTS跟AC-3的差异在于资料流量的大小,DTS在DVD上拥有1536kbps的资料流量,最大编码流量与LPCM相同,也就是每秒48000×16×2=1536000bit,与 AC-3的码率64kbps~448kbps相比较,足足多了3倍多的资料流量。即使将AC-3拉到极限的640kbps,DTS跟AC-3的流量相比还是强过2倍有余,这使得DTS能较AC-3听到更多的细节,整个空间感及移动感也更加优良、更加清楚。

 视频的大小:一帧全屏幕、全运动、全彩(640×480×24,30fps)的数字影像(包括同步声音)约有27.7MB,十分钟非压缩的数字视频影像约有16. 62GB。 目前流程的视频格式有:

   (1)MPEG-12347格式:MPEG-1即将VCD格式的MPEG数据码率固定在1.15 MBits/s,其视频压缩率为26∶1。使用MPEG-1的压缩算法,可以把一部120分钟长的多媒体流压缩到1.2GB左右大小;MPEG-2(标准代号IOS/IEC13818)于1994年发布国际标准草案(DIS),在视频编码算法上基本和MPEG-1相同,只是有了一些小小的改良;MPEG-3最初为HDTV制定,由于MPEG-2的快速发展,MPEG-3还未彻底完成便宣告淘汰;MPEG-4于1998年公布,和MPEG-2所针对的不同,MPEG-4追求的不是高品质而是高压缩率以及适用于网络的交互能力。MPEG-4提供了非常惊人的压缩率,如果以VCD画质为标准,MPEG-4可以把120分钟的多媒体流压缩至300M;MPEG7适用于图书馆档案查询,压缩比非常高,码率很低。现在常用的声音压缩标准有杜比和AC3两种。

   (2)流媒体格式:宽带高速接入互联网将越来越普及,其中最热门的应用大概就是在网上实时看电影、电视及收听广播了。只能在网络上实时收看的节目,我们一般称其为“流媒体”。目前网上使用的流媒体格式以 RM 和 ASF(MWV)为代表,其中 ASF(MWV)编码格式也是基于MPEG-4的。AnyChat的流媒体技术处于国内领先地位,流媒体的应用将在未来高速网络中越来越广泛。

原文地址:https://www.cnblogs.com/hsq0421/p/4169229.html