RNN模型(递归神经网络)简介

有些任务可以通过MLP多层感知器的神经网络,CNN卷积神经网络解决,因为那些任务内部的每一个前后无关联,无顺序,如MNIST手写数字子集,CIFAR子集等。

但是在自然语言处理中,每个字的前后有语义联系,或者在视频图像处理,或者在气象观测数据,股票交易数据方面,有前后的关联性,那么使用RNN网络,或者LSTM模型。

RNN模型的原理:

神经元的输出接入输入,使网络具有记忆功能。Xt输入,Ht输出,三条箭头的参数U,V,W是神经网络的参数,A是隐藏状态,代表记忆功能。

在时间上将该模型展开后如下:

输出为之前的各个参数相互的处理结果。

原文地址:https://www.cnblogs.com/bai2018/p/10466418.html