LSTMとGRUの導出

LSTM:とき思い出の長さは、ニューラルネットワークは長距離はRNNを扱うことができない依存関係解決することができる新しい改良型循環です。

 

 RNN元の中間層のみの状態、即ちH、それは短期的な入力に対して非常に敏感です。呼ばれる長期保存状態にするために、即ちC、ステータスを追加セル状態(セル状態)。

 

寸法は次の時間のように展開します。

 

 時刻tにおいて、3つの入力LSTMあり:ネットワーク時間の現在の入力値、時間LSTM出力値、及びタイミング・ユニットのステータスは、LSTM、2つの出力があります現在の時刻のタイミングLSTM電流出力値を、そして細胞状態。3つのステート制御スイッチコントロールの長期使用C:

 

このアルゴリズムでは三つの状態のゲート機能を使用して実装:

完全層に接続されているドア、入力ベクトル、出力ベクトルは0と1の間の実数です。

 

 

 原理ドア制御:我々は出力ベクトルのゲートを制御するために必要ベクトルを乗じ素子によれば、ゲートの出力が0または1であり、0ベクトルの任意代表乗じ0が経過していない、1を乗じた任意のベクトルを変更しません。

計算されたドアを忘れました:

 

 

 忘れ扉:予約の時間C_T-1数の決定部の状態は現在の状態をC_Tする、WFが忘れているドア重み行列、[HT-1、XT]は、2つの変数は、Bfはドアを忘れており、一緒にスプライス表しますオフセット項、シグモイド関数。

 

計算された入力ゲート:

 

 ドアを入力してください。状態ユニットC_Tを保存するためにどのくらいの時間を入力現在のネットワークX_Tを決定します。

最後のセル状態の出力と入力電流の電流入力が算出されます。

 

 

入力電流とゲートI_T状態C_Tにおける入力部によってC_T次ユニット状態C_T-1によって計算時に、現在のセル状態が乗算要素が乗算される。フォート忘れドア、二つの製品を追加することができ現在の長期記憶と思い出は新しいセルの状態を形成するために結合します。制御ゲートは、長い情報を保存するのに長い時間を忘れすることができますので。ドアの制御入力はメモリに無関係なコンテンツを回避します。

目標は、パラメータの8セットを学ぶことです。

 

重み行列を二つの行列をスプライスすることによって形成されます。伝搬時間の誤差が定義されている時刻tにおける誤差項の逆です。

 

 

 次のように重み行列が計算されます。

 

全体的なプロセスの概要:

元の入力電流ループが入力されるX_Tと前段の出力H_ {T-1}と状態の段階C_ {T-1}

X_TH_ {T-1}最初に遭遇した(忘れて忘れてドアをゲート)

F_ {T} =シグモイド(W_f [H_ {T-1}、X_T] + b_f)

機能ゲートを忘れた後に0と1の間の出力を生成F_Tどのくらい忘れ前の状態を表すC_ {T-1}場合、F_T代表的には忘れている全て0、1が完全に維持されます。

ルート上のもう一つX_TH_ {T-1}会う予定入力ゲート(INPUT門)の扉を入力するには、メモリをどの値が決定されます:

I_T =シグモイド(W_i [H_ {T-1}、X_T] + B + I)

またを通じて同時に魚機能新しいステータスを生成しますC'_t

C'_t = TANH(W_C [H_ {T-1}、X_T] + b_C)

今回は、C_ {T-1}F_TC'_tそれあなたはループ本体の現在の状態を判断することができますC_Tのを:

C_T = F_T * C_ {T-1} + I_T * C'_t

現在の状態では、当然、あなたがに行くことができるゲート(出力ゲート)の出力の:

o_t =シグモイド(W_o [H_ {T-1}、X_T] + b_o)

h_t = o_t * TANH(C_T)

上記式から、我々は簡単に通って、各ゲートは、同じであるフォームを見つけシグモイド、現在の入力機能が動作X_Tし、前回の出力H_ {T-1}情報の量を決定するために、0〜1の値を生成します。

 

 

おすすめ

転載: www.cnblogs.com/limingqi/p/12638664.html