1. HMM模型参数求解概述

　　　　HMM模型参数求解根据已知的条件可以分为两种情况。

　　　　第一种情况较为简单，就是我们已知

　　　　假设样本从隐藏状态

A = [a i j],

　　　　假设样本隐藏状态为

B = [b j (k)],

　　　　假设所有样本中初始隐藏状态为

Π = π (i) = C ( i ) \sum s = 1 N C ( s )

　　　　可见第一种情况下求解模型还是很简单的。但是在很多时候，我们无法得到HMM样本观察序列对应的隐藏序列，只有

2. 鲍姆-韦尔奇算法原理

　　　　鲍姆-韦尔奇算法原理既然使用的就是EM算法的原理，那么我们需要在E步求出联合分布

　　　　首先来看看E步，当前模型参数为

L (λ, λ ¯¯¯) = \sum d = 1 D \sum I P (I | O, λ ¯¯¯) l o g P (O, I | λ)

　　　　在M步，我们极大化上式，然后得到更新后的模型参数如下：　

λ ¯¯¯ = a r g

　　　　通过不断的E步和M步的迭代，直到

　　　　我们的训练数据为

　　　　首先看鲍姆-韦尔奇算法的E步，我们需要先计算联合分布

P (O, I | λ) = π i 1 b i 1 (o 1) a i 1 i 2 b i 2

　　　　我们的E步得到的期望表达式为：

L (λ, λ ¯¯¯) = \sum d = 1 D \sum I P (I | O, λ ¯¯¯) l o g P (O, I | λ)

　　　　在M步我们要极大化上式。由于

λ ¯¯¯ = a r g

　　　　我们将上面

λ ¯¯¯ = a r g

　　　　我们的隐藏模型参数

　　　　首先我们看看对模型参数

π i ¯¯¯¯¯ = a r g

　　　　由于

a r g

　　　　其中，

\sum d = 1 D P (O, i (d) 1 = i | λ ¯¯¯) + γ π i = 0

　　　　令

\sum d = 1 D P (O | λ ¯¯¯) + γ = 0

　　　　从上两式消去

π i = \sum d = 1 D P ( O , i ( d ) 1 = i | λ ¯¯¯ ) \sum d = 1 D P (

P (i (d) 1 = i | O (d), λ ¯¯¯) = γ (d) 1 (i)

　　　　因此最终我们在M步

π i = \sum d = 1 D γ ( d ) 1 ( i ) D

　　　　现在我们来看看

\sum d = 1 D \sum I \sum t = 1 T - 1 P (O, I | λ ¯¯¯) l o g

　　　　由于

a i j = \sum d = 1 D \sum t = 1 T - 1 P ( O ( d ) , i ( d )

a i j = \sum d = 1 D \sum t = 1 T - 1 ξ ( d ) t ( i , j ) \sum

　　　　现在我们来看看

\sum d = 1 D \sum I \sum t = 1 T P (O, I | λ ¯¯¯) l o g

　　　　由于

b j (k) = \sum d = 1 D \sum t = 1 T P ( O , i ( d ) t = j |

b j (k) = \sum d = 1 D \sum t = 1 , o ( d ) t = v k T γ

　　　　有了

　　　　这里我们概括总结下鲍姆-韦尔奇算法的流程。

　　　　输入：

　　　　输出：HMM模型参数

　　　　1)随机初始化所有的

　　　　2) 对于每个样本

　　　　3) 更新模型参数：

π i = \sum d = 1 D γ ( d ) 1 ( i ) D

a i j = \sum d = 1 D \sum t = 1 T - 1 ξ ( d ) t ( i , j ) \sum

b j (k) = \sum d = 1 D \sum t = 1 , o ( d ) t = v k T γ

　　　　4) 如果

　　　　以上就是鲍姆-韦尔奇算法的整个过程。

转载：http://www.cnblogs.com/pinard/p/6972299.html

http://www.itdadao.com/articles/c15a132036p0.html