htk base tutorail error summary

问题总结:

 

1、录音,HSLab程序特别容易死机,且每次只能连录两个文件,第三个就开始覆盖了,程序貌似有bug

 

 

2、声学分析时候,产生mfcc

其中config文件写的不规范,导致一些错误,后来成功产生了20个mfcc文件

3、初始化,HInit –A –D –T 1 –S trainlist_yes.txt –M model/hmm0 –H model/proto/hmm_yes.hmm不能少)(修改很多)

 

4、命令中大小写有很大影响

 

5、在创建字典时候:

YES [yes]   yes                     

NO   [no] no               

START_SIL [sil] sil             

END_SIL [sil] sil   

 

 

 

 

6、初始化时候:

 

 

 

HInit -A -D –T 1 -S trainlist.txt -M model/hmm0

-H model/proto/hmmfile –l(要大些L,否则有错误,后来小写也行,还是小写吧)label -L label_dir nameofhmm

注:中间要有空格,结尾要空格,最后一行要回车

 

 

 

 

 

7、算出的三个vFloors文件里面内容完全一样,故只算一个即可

 

8、vFloors

要自己在文件的头加上下面的代码:

问题自己解决了,呵呵
vFloors文件要符合HMM的格式,所以在vFloors文件的开头要自己添加
~o
<VECSIZE> 39
<MFCC_0_D_A>
...

方可编译成功

 

实验结果:识别的都是yes,不知道哪地方出现问题了,

猜想1:标注错误,应该要连续

且后来发现,lab文件里的内容有问题

连续录音导致的

教训,每搞一次,quit一次,检查lab文件一次

问题解决,猜想正确,就是这个原因!!!

 

结果:识别率100%

至此,其实已经对孤立词识别搭建了一个完整的平台!!!

原文地址:https://www.cnblogs.com/ldjhust/p/3182520.html