学习笔记 | 深入理解LSTM网络

概要

Long Short Term Memory networks,简称作LSTM。

Recurrent Neural Networks

Recurrent Neural Networks,简称作RNN,其结构包含回环,可以用来解决有信息停留的问题。

其基本机构如下图所示:

如上图所示,神经网络的一块,A,获得输入xt,并产生输出ht。该结构允许把信息传递给下一个时刻。

一个RNN可以看成许多个相同神经网络的复制,一个神经网络把信息传递给下一个神经网络。如果我们把这个回环打开,就变成下图所示的结构:

这种结构自然被用于语音识别(speech recognition),语言建模( language modeling),翻译(translation),图片抓取(image captioning)等问题中。应用范围还在不断扩展中。

长期依赖问题(The Problem of Long-Term Dependencies)

参考

原文地址:https://www.cnblogs.com/casperwin/p/6396044.html