共振峰估计基础

什么是共振峰及共振峰的作用
  前面讲过语音的激励模型,当声门周期脉冲激励信号通过声道时,会在声道内引起共振作用(这个过程在语音产生模型中叫做声道模型),从而产生一组共振频率,这组共振频率就被称为共振峰(频率),通常认为,语音谱包络中的几个极大值就是共振峰频率。准确的检测共振峰频率和带宽,有利于区分不同韵母,从于提高对语音语义的识别度。
 
共振峰估计的困难
(1)虚假共振峰的存在。
(2)相邻共振峰频率离的比较近时难以区分
(3)高音调语音的提取有一定困难。
总之,跟基音周期估计一样,目前尚没有一个完全准确的估计方法。
 
共振峰估计预处理
(1)预加重。目的是为了对去除口唇辐射的影响,便于对声道响应进行分析。
(2)端点检测。目的跟基音周期估计一样,不需要对静音段的语音做分析。
 
共振峰估计的方法
(1)倒谱法。
  对语音做倒谱处理可以把激励信号与声道响应分离出来,然后去掉激励信号,之后再做傅里叶变换,就可以得到声道响应的包络线,对包络上寻找极大值,就是相应的共振峰频率。
(2)LPC法
  由于通过线性预测我们可以求出一组预测系数,根据这组系数和全极点声道响应模型进行FFT变换,就可以得到声道传递函数的功率谱,再通过计算得到相应的极大值,就可以得到对应的共振峰频率
(3)HHT法
  这个方法还没有细看,具体步骤还不详,主要是通过经验模态分解(EMD)和希尔伯特变换来求信号的幅值,频率、相位。
原文地址:https://www.cnblogs.com/icoolmedia/p/resonance_peak_estimation.html