RNN,LSTM

RNN:

Vanilla Neural Network :对单一固定的输入给出单一固定输出

Recurrent Neural Network:对单一固定的输入给出一系列输出(如:可边长序列),例:图片描述

            对可变尺寸输入给出单一固定输出,例:语句的情感分析,对视频(时间长度可变)做决策

            对可变尺寸输入给出可变尺寸输出,例:机器翻译,对视频做帧数分类 

x作为输入传入RNN,RNN有一个内部隐藏态(internal hidden state),整个隐藏态会在RNN每次读取新的输入时更新,隐藏态会在下次读取输入时将结果反馈至模型。ht代表新的状态,fw代表一种循环函数机制,xt代表输入每个时步的fw和权重都相同。

 对可变尺寸输入给出可变尺寸输出:

 

 对可变尺寸输入给出单一固定输出

 

对单一固定的输入给出一系列输出

 多对多:机器翻译:

机器翻译使用序列to序列模型,既一对多和多对一组合,编码器是多对一模型,输入句子,输出向量;解码器是一对多模型,输入向量,输出预测结果

由预测结果的损失函数,同时训练编码器和解码器

 语言模型:

通常采用截取方法计算梯度,避免梯度爆炸

 

RNN注意力

LSTM:

 

1

原文地址:https://www.cnblogs.com/Manuel/p/11164849.html