音频基本概念

声音的本质

音调:频率
音量:振幅
音色:与材质有关,谐波(不规则的正玄波)

 
 
屏幕快照 2018-12-04 下午1.53.40.png

采样-量化-编码

采样大小:

一个采样用多少bit存放,目前常用16bit

采样率:

每秒采样多少次, 单位k,常见采样频率:8k、16k、32k、44看、48k;

声道数:

单声道、双声道、多声道

码率:

采样率 X 采样大小 X 声道数


压缩

消除冗余数据

人耳听觉范围外的音频信号: 20hz-20000hz

频域遮蔽效应
  • 去除人耳听觉频率范围临界附近的值
  • 大声音附近如果有小的声音可以去除
时域屏蔽效应
  • 高声附近50ms内如果声音比较小可以去掉
无损压缩
 


 
 

常见的音频编码器

OPUS、AAC、Vorbis、Speex、iLBC、AMR、G.711等

OPUS:
  • 目前性能最好、质量最高,但是由于时间短,暂时还没有普及,rtmp协议还不支持它。
AAC:
  • 有损压缩算法,目的取缔mp3,压缩率很高、但还能接近原始的质量;
  • MPEG-4标准出现后,加入了SBR技术和PS技术,目前常用规格有AAC LC、AAC HE V1、AAC HE V2;
  • AAC LV:低复杂度,码流128k
  • AAC HE V1:AAC+SBR 分频编码,低频(减少采样率)和高频(增加采样率)分开编码
  • AAC HE V2:AAC+SBR+PS 由于声道间相同的性质很大,所以对于其它声道只要存储一些差异性的特征
  • AAC格式: ADIF-只能从头开始解码,常用于磁盘文件中;ADTS 每帧都有一个头信息,可以在音频流的任何位置解码,但是占用比较大。
  • AAC编码库:Libfdk_AAC > ffmpeg AAC > libfaac > libvo_aacenc

性能对比

 



作者:夏趣意转秋来
链接:https://www.jianshu.com/p/6fcbfb99b5c1
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

原文地址:https://www.cnblogs.com/mingjing/p/10826690.html