音频信号质量的度量标准--MOS得分的由来

　　早期语音质量的评价方式是凭主观的，人们在打通电话之后通过人耳来感知语音质量的好坏。1996年国际ITU组织在ITU-T P.800和P.830建议书开始制订相关的评测标准：MOS（Mean Opinion Score）测试。

它是一种主观测试方法，将用户接听和感知语音质量的行为进行调研和量化，由不同的调查用户分别对原始标准语音和经过无线网传播后的衰退声音进行主观感受对比，评出MOS分值，

在后来的研究和探索中，先后出现了如下几种客观测量方法：　

　　PSQM和PAMS测量方法都需要发送一个语音参考信号通过电话网络，在网络的另一端采用数字信号处理的方式比较样本信号和接收到的信号，进而估算出网络的语音质量。PESQ结合了PSQM和PAMS的优势，并针对MOS和MOS-LQ(Listening Quality)计算方法做了修改。

最开始这些方法被用于测量编码算法和在实验室分析设备问题，如分析电话机的语音质量；并且都是基于PSTN网络，因此并不适合应用到VoIP网络系统的语音测量。这些方法主要缺点体现在：　　

　　此外，有必要指出，平均主观值MOS是广泛认同的语音质量标准。因此，无论采用何种方法，所有测量方法所得到的结果都必须对应到最终的平均主观值MOS。

参考文档：