Sphinx语音识别学习记录 (一)基本运行测试

CMUSphinx系列目录
http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - (一)基本运行测试

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - (二)自然语言处理原理研究

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - (三)小范围语音英文识别

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - (四)小范围语音中文识别

http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - (五)错误调试

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - (六)我的目标和几个想像的方案(闲置中)

这一阵子因为个人的某个需求开始研究语音识别

找了一阵子之后决定选择研究下cmusphinx

下面是官方的介绍

http://cmusphinx.sourceforge.net/wiki/

现在网上相关资料基本只有官方的帮助文档和下面的Sphinx武林秘籍了

http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html

运行版本为

pocketsphinx 0.7

sphinxbase 0.7

 先可以尝试跟上面的 武林秘籍里的一样,跑起样例项目pocketsphinx_continuous

这个有助于抓住基本使用方式和脉路

pocketsphinx_continuous 跟武林秘籍一样输入两套参数的话 我这里会报错、会表示我没指定声学模型

我是添加了这个参数、使用自带的模型算法

-hmm

hub4wsj_sc_8k

然后就是几个参数的意义

hmm Hidden Markov Model隐马尔可夫模型 模型训练算法
lm language model
dict 字典、 这几种东西以前没搞过语音识别、完全不懂、从头开始查资料学习的

 

 command.txt

stop
music
computer
dump
close

用这个文本使用lmtool创建了语言模型和字典

7721.lm   7721.dic

pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic 

中间运行到这

Allocating 32 buffers of 2500 samples each
READY....

Listening...

这里你就用麦克风说话、他就帮你识别是什么。。。空白时间间隔在1s时会停止录音

下面这种是识别出来的结果

000000000: STOP (-6531224)

我使用的自带的 hub4wsj_sc_8k 这个模型、不知道是口音问题还是基础的模型问题、句子稍长点就 老多识别出来好几个dump

 (该问题后面已找到问题并解决)

文章出处:http://www.cnblogs.com/yin52133/ 本文可自行转载,但转载时记得给出原文链接
原文地址:https://www.cnblogs.com/yin52133/p/2557219.html