机器学习（第五章）

神经元模型#

最普遍的定义是：神经网络是由具有适应性的简单单元组成的广泛并行互联的网络，它的组织能够模拟生物神经系统对真实世界物体做出的交互反应。

神经网络的最基本成分是神经元模型。在生物网络中，神经元的活动是以0或1的状态存在的，一个神经元可以接受多个神经元的信号输入，当所有输入超出阈值时，接受输入的神经元就会发放（兴奋起来），然后向其他的神经元发送信号。只要没有超出阈值，不管输入的量有多大，该神经元都不会兴奋、并向其他神经元发送信号。（神经元的输入既可以是兴奋性的也可以是抑制性的）

下图即是在1943年提出的最简化的抽象模型，

McCullosh and Pitts,M-P神经元模型

[y=f(sum_{i=1}^n{w_i}{x_i}- heta) ]

每个输入和他们的权重的乘积的和，再减去阈值theta，就是该接受输入的神经元的输出了，这个输出要么为0，要么为1.激活函数（activation function）就是将输入和阈值进行比较，然后决定是输出0还是1的函数（即上图中Threshold T上方方框中的图形所代表的函数-跃迁函数）。但是由于跃迁函数不连续，不光滑，所以实际多采用下方的Sigmoid函数作为激活函数使用。

Sigmoid函数

在计算机科学中，一个神经网络是包含了许多参数的数学模型，而这个数学模型又是由上述激活函数这样的若干个函数组成的。

感知机与多层网络#

感知机由两层神经元组成，输入层接受到信号后传递给输出层（M-P神经元），他也被称为“阈值逻辑单元”，可以实现“与”、“或”、“非”的运算。

如上述M-P神经元抽象简化模型。

当x>或=0时，y=1，当x<0时，y=0

与：如果$$w_1=w_2=1, heta=2$$，仅在$$x_1=x_2=1$$时，$$y=f(w_1x_1+w_2x_2- heta)=f(0)=1$$

或：如果$$w_1=w_2=1, heta=0.5$$，当$$x_1=1或者x_2=1$$时，$$y=f(1x_1+1x_2-0.5)=1$$

非：如果$$w_1=-0.6;w_2=0, heta=-0.5$$，在$$x_1=1$$时，$$y=f(-0.6*x_1+0+0.5)=f(-0.1)=0$$;在$$x_1=0$$时，$$y=f(0.5)=1$$