语音交互技术——语音信号特征提取

1.短时能量分析(音强),决定短时能量特性有两个条件:不同的窗口的形状和长度。窗长越长,频率分辨率越高,而时间分辨率越低(N为帧长,M为步长)。

image

*典型窗函数:矩形窗谱平滑性能好,但损失高频成分,波形细节丢失,海明窗与之相反。一帧内含1~7个基音周期,10kHz下采100~200点。

imageimage

2.短时平均振幅分析:计算方法简单,但清浊音的区分不如能量明显。

image

3.短时过零分析:可以区分清音与浊音,浊音时具有较低的平均过零数,而清音时具有较高的平均过零数;可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。

image

4.短时相关分析:自相关用于研究信号本身,如信号波形的同步性、周期性等。用来区分清音和浊音,因为浊音信号是准周期性的,对浊音语音可以用自相关函数求出语音波形序列的基音周期;另外在进行语音信号的线性预测分析时,也要用到短时自相关函数。

image

image

image

4.短时平均幅度差:短时平均幅度差计算加、减法和和取绝对值的运算,与自相关函数的相加与相乘的运算相比,其运算量大大减小,尤其在硬件实现语音信号分析时有很大好处。为此,AMDF已被用在许多实时语音处理系统中。

image

image

5.短时傅里叶变换:

image

image

6.语音信号的倒谱分析:求语音倒谱特征参数,通过同态处理(将非线性问题转化为线性问题)来实现。同态处理(同态滤波):解卷,将卷积关系变为求和处理。 将语音信号的声门激励和声道响应分离开。

image

image

image

7.基音周期的提取:

a)自相关法:峰—峰值之间对应的就是基音周期。为去除声道影响,一般进行中心削波的非线性变换(削除低幅部分)。

image

b)倒谱法:图a为ln|X(ejw)|的示意图,包括频谱包络的慢变分量,基音谐波峰值的快变分量。再取一次傅里叶反变换,即可将快慢分量分离开。

image

基音周期后处理:中值平滑、线性平滑、组合平滑。

原文地址:https://www.cnblogs.com/jizhiyuan/p/3739765.html