Embedded training,嵌入式训练

一旦初始的模型集被创建后, HERest使用整个训练集来执行"嵌入式训练(embedded training)",HERest将对全部HMM音素集模型执行一次Baum-Welch,同时重估这些模型的参数。对于每条训练语句,此训练数据包含的相应的音素模型(HMM)将会被连接起来(形成一个大HMM)。前向-后向算法将对序列中(哪个序列?)的每个HMM模型累加状态占有率(.OCCS file?)、均值、方差等统计信息。当处理完所有的训练数据后,累加的统计量将被用来计算模型的参数重估值(为何要处理完才能计算,mdl模型的结构是什么?猜测是一个大型的HMM)。HERest是HTK训练工具的核心。其被设计用来处理大规模的数据库。也可以很方便地使用裁减策略来减少运算量。能够在网络中并行执行(译者注:可将训练数据分成多份,同时并行计算,然后使用累计的统计量重估模型)。

原文地址:https://www.cnblogs.com/JarvanWang/p/7499570.html