音频格式opus

  1. 人耳能听到自然界的声音是20HZ-20KHZ,一般高保真音质采样率只有达到最高采样率的2倍以上即可,平时电话采样率8KHZ,CD音质的采样率44.1KHZ。
  2. IBM 的Watson的音频转文字接口支持的音频文件类型为wav、flac、opus,其中前面两个是无损压缩算法,后面一个opus是最新的有损压缩算法
  3. 常见的有损音频算法是MP3,它是MEPG1的音频编码算法,在互联网音频有广泛的应用。然后再MPEG2、MPEG4推荐的音频编码算法是AAC,同样码率下比Mp3的音质更好,同样音质下比MP3的文件更小些。而opus是最新出的开源音频编码算法,拥有更好的压缩比。晚上试了一下用ffmpeg将同样的mp4文件转换成AAC或opus格式,默认参数情况下opus文件格式只有AAC的2/3。
  4. 常见的编码模式:VBR(Variable Bitrate)动态比特率 也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;ABR(Average Bitrate)平均比特率 是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。CBR(Constant Bitrate),常数比特率 指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。

原文地址:https://www.cnblogs.com/doit8791/p/7868341.html