简介

其实吧，一般在神经网络中用的最多的是sigmoid和tanh，当然也有用relu的。这是针对“是”和“否”的分类，但当进行多分类时，就要用到softmax 。

在logistic回归中，训练样本是：

在logistic回归中，激活函数是：

h θ (x) = 1 1 + e x p ( - θ T x )

训练

J (θ) = - 1 m [ \sum i = 1 m y ( i ) log h θ ( x ( i ) ) + ( 1 - y ( i ) ) log ( 1 -

我们要做的是分类，因此当然是想知道，当输入x是，x分别属于每一个类的概率，概率最大的那个就是我们认为的属于的类。
让输出为一个向量，并且有

h θ (x (i)) = ⎡⎣⎢⎢⎢⎢⎢ p (y (i) = 1 ∣ x (i); θ) p (y (i) = 2 ∣ x

这里的

上面的公式真难打。。
可以看出，我们将

softmax模型参数
softmax模型的参数是k个n+1维的

θ = ⎡⎣⎢⎢⎢⎢⎢ θ T 1 θ T 2 ⋮ θ T k ⎤⎦⎥⎥⎥⎥⎥

代价函数

J (θ) = - 1 m ⎡⎣ \sum i = 1 m \sum j = 1 k 1 { y ( i ) = j } log e θ

J (θ) = - 1 m [ \sum i = 1 m ( 1 - y ( i ) ) log ( 1 - h θ ( x ( i ) ) ) + y ( log

p (y (i) = j | x (i); θ) = e θ T j x ( i ) \sum k l = 1 e θ T

\nabla θ j J (θ) = - 1 m \sum i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p (

虽然代价函数是上面形式，但是一般是添加一个权重衰减项

J (θ) = - 1 m ⎡⎣ \sum i = 1 m \sum j = 1 k 1 { y ( i ) = j } log e θ

\nabla θ j J (θ) = - 1 m \sum i = 1 m [ x ( i ) ( 1 { y ( i ) = j } - p ( y