chainer.functions.n_step_bilstm

`chainer.functions.n_step_bilstm`(n_layers, dropout_ratio, hx, cx, ws, bs, xs)[source]¶

積層型双方向（Bi-dimensional） LSTM関数。

この関数はシーケンスを積層型双方向LSTMで演算します。この関数の隠れ状態の初期値 $h_{0}$ 、セル状態の初期値 $c_{0}$ 、入力シーケンス $x$ 、荷重行列 $W$ 、そしてバイアスベクトル $b$ 。この関数は入力 $x_{t}$ の各時刻 $t$ の隠れ状態 $h_{t}$ と $c_{t}$ を計算します

i f t f f t o f t a f t c f t h f t i b t f b t o b t a b t c b t h b t h t = = = = = = = = = = = = = σ (W f 0 x t + W f 4 h t - 1 + b f 0 + b f 4), σ (W f 1 x t + W f 5 h t - 1 + b f 1 + b f 5), σ (W f 2 x t + W f 6 h t - 1 + b f 2 + b f 6), tanh (W f 3 x t + W f 7 h t - 1 + b f 3 + b f 7), f f t \cdot c f t - 1 + i f t \cdot a f t, o f t \cdot tanh (c f t), σ (W b 0 x t + W b 4 h t - 1 + b b 0 + b b 4), σ (W b 1 x t + W b 5 h t - 1 + b b 1 + b b 5), σ (W b 2 x t + W b 6 h t - 1 + b b 2 + b b 6), tanh (W b 3 x t + W b 7 h t - 1 + b b 3 + b b 7), f b t \cdot c b t - 1 + i b t \cdot a b t, o b t \cdot tanh (c b t), [h f; h b]

ただし、 $W^{f}$ は順方向LSTMの荷重行列、 $W^{b}$ は逆方向LSTMの荷重行列。

この関数がシーケンスを受け入れるため、全ての時刻l $t$ の $h_{t}$ fを一度の呼び出しで計算します。８つの荷重行列と８つのバイアスベクトルが各層で要求されます。そのため、 $S$ 層が存在するとき、 $8 S$ 荷重行列と $8 S$ バイアスベクトルを用意する必要があります。

層の数 n_layers が $1$ より大きい時、k番目の層の入力は k-1番目の層の隠れ状態 h_t です。 Note that all input variables except first layer may have different shape from the first layer.

Warning: train と use_cudnn 引数はv2以降は、サポートされません。替わりに chainer.using_config('train', train) とchainer.using_config('use_cudnn', use_cudnn) をお使いください。chainer.using_config()もお読みください。

Parameters:

Parameters:	n_layers (int) – 層の数 dropout_ratio (float) – ドロップアウト比 hx (chainer.Variable) – 積層型隠れ状態を保持する変数。shape は `(S, B, N)` 、ただし `S` は層の数で `n_layers`に等しい。 `B` はミニバッチサイズ。 `N` は隠れユニットの次元。 cx (chainer.Variable) –　積層型セル状態を保持している変数。 `hx`とおなじshape。 ws (list of list of chainer.Variable) – 荷重行列。 `ws[i]` はi番目の層の荷重を表す。各`ws[i]` は８つの行列を含むリスト。 `ws[i][j]` は等式中の`W_j` に相当する。 `ws[0][j]` のみ、ただし`0 <= j < 4` が入力変数の倍数となるため`(I, N)` shape。他の行列は全て `(N, N)` shape。 bs (list of list of chainer.Variable) – バイアスベクトル。 `bs[i]` はi番目の層のバイアスを表す。各`bs[i]` は8つのベクトルを表す。`bs[i][j]` は等式中の `b_j`に相当する。各行列のshapeは. `(N,)` 、ただし、 `N` は隠れユニットの次元。 xs (list of chainer.Variable) – 入力値を保持している `Variable`のリスト。 `xs[t]` の各要素は時刻 `t`の入力値を保持する。その shape は `(B_t, I)`、ただし `B_t` は時刻`t` のミニバッチサイズ。 `I` は入力ユニットのサイズ。この関数は可変長のシーケンスをサポートしていることに注意すること。複数のシーケンスが異なる長さの場合、シーケンスを長さによって降順にソートし、ソートされたシーケンスを転置する。`transpose_sequence()` はシーケンスを保持している `Variable()` のリストを転置する。そのため `xs`は`xs[t].shape[0] >= xs[t + 1].shape[0]`を満たさなければならない。
Returns:	この関数は３つの要素 `hy`、 `cy` 、 `ys`を返す。 `hy` は更新された隠れ状態で、そのshapeは `hx`と同じ。 `cy` は更新されたセル状態で、そのshapeは`cx`と同じ。 `ys` は `Variable` のリスト。各要素 `ys[t]` は入力`xs[t]`に相当する、最後の層の隠れ状態を保持しているそのshape は `(B_t, 2N)` で、ただし `B_t` は時刻 `t`のミニバッチサイズ、 `N` は隠れユニットのサイズ。`B_t` は `xs[t]`と同じ値なので注意すること。
Return type:	tuple

n_layers (int) – 層の数
dropout_ratio (float) – ドロップアウト比
hx (chainer.Variable) – 積層型隠れ状態を保持する変数。shape は (S, B, N) 、ただし S は層の数で n_layersに等しい。 B はミニバッチサイズ。 N は隠れユニットの次元。
cx (chainer.Variable) –　積層型セル状態を保持している変数。 hxとおなじshape。
ws (list of list of chainer.Variable) – 荷重行列。 ws[i] はi番目の層の荷重を表す。各ws[i] は８つの行列を含むリスト。 ws[i][j] は等式中のW_j に相当する。 ws[0][j] のみ、ただし0 <= j < 4 が入力変数の倍数となるため(I, N) shape。他の行列は全て (N, N) shape。
bs (list of list of chainer.Variable) – バイアスベクトル。 bs[i] はi番目の層のバイアスを表す。各bs[i] は8つのベクトルを表す。bs[i][j] は等式中の b_jに相当する。各行列のshapeは. (N,) 、ただし、 N は隠れユニットの次元。
xs (list of chainer.Variable) – 入力値を保持している Variableのリスト。 xs[t] の各要素は時刻 tの入力値を保持する。その shape は (B_t, I)、ただし B_t は時刻t のミニバッチサイズ。 I は入力ユニットのサイズ。この関数は可変長のシーケンスをサポートしていることに注意すること。複数のシーケンスが異なる長さの場合、シーケンスを長さによって降順にソートし、ソートされたシーケンスを転置する。transpose_sequence() はシーケンスを保持している Variable() のリストを転置する。そのため xsはxs[t].shape[0] >= xs[t + 1].shape[0]を満たさなければならない。

Returns:

この関数は３つの要素 hy、 cy 、 ysを返す。

hy は更新された隠れ状態で、そのshapeは hxと同じ。
cy は更新されたセル状態で、そのshapeはcxと同じ。
ys は Variable のリスト。各要素 ys[t] は入力xs[t]に相当する、最後の層の隠れ状態を保持しているそのshape は (B_t, 2N) で、ただし B_t は時刻 tのミニバッチサイズ、 N は隠れユニットのサイズ。B_t は xs[t]と同じ値なので注意すること。

Return type:

tuple

chainer.functions.n_step_bilstm(n_layers, dropout_ratio, hx, cx, ws, bs, xs)[source]¶

`chainer.functions.n_step_bilstm`(n_layers, dropout_ratio, hx, cx, ws, bs, xs)[source]¶