应用HTK搭建语音拨号系统4: 识别器评估

选自:http://maotong.blog.hexun.com/6261890_d.html

苏统华

哈尔滨工业大学人工智能研究室

2006年10月30日

 

声明:版权所有,转载请注明作者和来源

该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。

4. 识别器评估

 

[step 11]验证测试结果

Viterbi算法进行识别已经在前文又多处涉及,这里轻松了,执行如下命令:

HVite -C .configconfig2 -H .hmmshmm15macros -H .hmmshmm15hmmdefs -S test.scp -l * -i . esults ecout_step11.mlf -w wdnet -p 0.0 -s 5.0 .dictdict4 .lists iedlist

其中的config2(前文已经提到过)在config基础上加入FORCECXTEXP=TALLOWXWRDEXP=F。进行识别验证:

HResults -I .labels estwords.mlf .lists iedlist . esults ecout_step11.mlf

所得结果如下:

 

====================== HTK Results Analysis =======================

  Date: Tue Oct 31 10:06:53 2006

  Ref : .labels estwords.mlf

  Rec : . esults ecout_step11.mlf

------------------------ Overall Results --------------------------

SENT: %Correct=93.33 [H=14, S=1, N=15]

WORD: %Corr=100.00, Acc=98.53 [H=68, D=0, S=0, I=1, N=68]

==============================================================

 

原文地址:https://www.cnblogs.com/welen/p/3781901.html