应用HTK搭建语音拨号系统4：识别器评估

选自：http://maotong.blog.hexun.com/6261890_d.html

苏统华

哈尔滨工业大学人工智能研究室

2006年10月30日

该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素)，具有一定的可扩充性。当加入一个新名字时，只需修改发音词典和任务语法即可。模型为连续混合高斯输出，运用语音决策树聚类形成的绑定状态式三音素。

4. 识别器评估

[step 11]验证测试结果

用Viterbi算法进行识别已经在前文又多处涉及，这里轻松了，执行如下命令：

HVite -C .configconfig2 -H .hmmshmm15macros -H .hmmshmm15hmmdefs -S test.scp -l * -i . esults ecout_step11.mlf -w wdnet -p 0.0 -s 5.0 .dictdict4 .lists iedlist

其中的config2（前文已经提到过）在config基础上加入FORCECXTEXP=T，ALLOWXWRDEXP=F。进行识别验证：

HResults -I .labels estwords.mlf .lists iedlist . esults ecout_step11.mlf

所得结果如下：

====================== HTK Results Analysis =======================

Date: Tue Oct 31 10:06:53 2006

Ref : .labels estwords.mlf

Rec : . esults ecout_step11.mlf

------------------------ Overall Results --------------------------

SENT: %Correct=93.33 [H=14, S=1, N=15]

WORD: %Corr=100.00, Acc=98.53 [H=68, D=0, S=0, I=1, N=68]

==============================================================