BiLSTM的计算公式
时间: 2024-06-15 12:06:08 浏览: 117
专199-TCN-BiLSTM-Attention单变量时间序列多步预测
BiLSTM(双向长短时记忆网络)是一种常用的循环神经网络(RNN)变体,它在处理序列数据时能够同时考虑上下文信息。BiLSTM由两个LSTM组成,一个按正序处理输入序列,另一个按逆序处理输入序列。下面是BiLSTM的计算公式:
正向传播:
1. 输入门(input gate):$i_t = \sigma(W_{ix}x_t + W_{ih}h_{t-1} + b_i)$
2. 遗忘门(forget gate):$f_t = \sigma(W_{fx}x_t + W_{fh}h_{t-1} + b_f)$
3. 输出门(output gate):$o_t = \sigma(W_{ox}x_t + W_{oh}h_{t-1} + b_o)$
4. 候选记忆细胞(candidate memory cell):$\tilde{C}_t = \tanh(W_{cx}x_t + W_{ch}h_{t-1} + b_c)$
5. 记忆细胞(memory cell):$C_t = f_t \odot C_{t-1} + i_t \odot \tilde{C}_t$
6. 隐状态(hidden state):$h_t = o_t \odot \tanh(C_t)$
逆向传播:
1. 输入门(input gate):$\tilde{i}_t = \sigma(W_{ix}\tilde{x}_t + W_{ih}\tilde{h}_{t+1} + b_i)$
2. 遗忘门(forget gate):$\tilde{f}_t = \sigma(W_{fx}\tilde{x}_t + W_{fh}\tilde{h}_{t+1} + b_f)$
3. 输出门(output gate):$\tilde{o}_t = \sigma(W_{ox}\tilde{x}_t + W_{oh}\tilde{h}_{t+1} + b_o)$
4. 候选记忆细胞(candidate memory cell):$\tilde{\tilde{C}}_t = \tanh(W_{cx}\tilde{x}_t + W_{ch}\tilde{h}_{t+1} + b_c)$
5. 记忆细胞(memory cell):$\tilde{C}_t = \tilde{f}_t \odot \tilde{C}_{t+1} + \tilde{i}_t \odot \tilde{\tilde{C}}_t$
6. 隐状态(hidden state):$\tilde{h}_t = \tilde{o}_t \odot \tanh(\tilde{C}_t)$
其中,$x_t$表示输入序列的第$t$个元素,$h_t$表示正向传播的隐状态,$\tilde{x}_t$表示逆向传播的输入序列的第$t$个元素,$\tilde{h}_t$表示逆向传播的隐状态。$W$和$b$是模型的参数,$\sigma$表示sigmoid函数,$\odot$表示逐元素乘法。
阅读全文