循环神经网路 RNN

MoyiTech

2023-09-26 / 0 评论 / 124 阅读 / 正在检测是否收录...

09/26

温馨提示：

本文最后更新于2023年09月26日，已超过692天没有更新，若内容或图片失效，请留言反馈。

普通的RNN：小数据集低算力

S = f (w_{i n} X_{t} + b)

S_{t} = f (W_{i n} X_{t} + W_{S} S_{t - 1} + b)

输入序列，单输出

单输入，输出序列

输入不随序列变化

原始的N to N的RNN要求序列等长，然而我们遇到的大部分问题序列都是不等长的，如机器翻译中，源语言和目标语言的句子往往并没有相同的长度。
下面介绍RNN最重要的一个变种：N to M。这种结构又叫Encoder-Decoder模型，也可以称之为Seq2Seq模型。

从名字就能看出，这个结构的原理是先编码后解码。左侧的RNN用来编码得到c，拿到c后再用右侧的RNN进行解码。得到c有多种方式：

长短期记忆网络 LSTM

f_{1} = s i g m o i d (w_{1} [\begin{matrix} S_{t} - 1 \\ x_{t} \end{matrix}] + b_{1})

f_{2} = s i g m o i d (w_{2} [\begin{matrix} S_{t} - 1 \\ x_{t} \end{matrix}] + b_{2}) * t a n h (w_{2}^{'} [\begin{matrix} S_{t} - 1 \\ x_{t} \end{matrix}] + b_{2}^{'})

c_{t} = f_{1} * c_{t - 1} + f_{2}

循环神经网路 RNN