chainer.functions.n_step_rnn

`chainer.functions.n_step_rnn`(n_layers, dropout_ratio, hx, ws, bs, xs, activation='tanh')[source]¶

シーケンス入力のための積層一方向 RNN 関数。

この関数はシーケンスを伴う積層一方向RNNを計算します。隠れ状態の初期値 $h_{0}$ 、セル状態の初期値 $c_{0}$ 、入力シーケンス $x$ 、荷重行列 $W$ 、バイアスベクトル $b$ . を取得します。また、各時間 $t$ において、入力 $x_{t}$ から隠れ状態 $h_{t}$ と $c_{t}$ を計算します。 $h_{0}$ $c_{0}$ $x$ $W$ $b$ $h_{t}$ $c_{t}$ $t$ $x_{t}$

h t = f (W 0 x t + W 1 h t - 1 + b 0 + b 1)

は活性関数。 荷重行列 W は2つの行列 W f と W b を含みます。 W f は順方向のRNNの荷重行列です。 W b 逆方向のRNNの荷重行列です。 W f は入力シーケンスのための W f 0 と隠れ状態のための W f 1 を含みます。 W b は入力シーケンスのための W b 0 と隠れ状態のための W b 1 を含みます。 バイアス行列 b は２つの行列 b f と b f を含みます。 b f は入力シーケンスのための b f 0 と隠れ状態のための b f 1 を含みます。 b b は入力シーケンスのための b b 0 と隠れ状態のための b b 1 を含みます。 この関数はシーケンスを受容するので、全ての t における h t を一度の呼び出しで計算します。 ２つの荷重行列と２つのバイアスベクトルは各層について必要になります。ですから S 層が存在する場合、 2 S 個の荷重行列と 2 S 個のバイアスベクトルを用意する必要があります。 層の数 n_layers が 1 より大きい場合、 k 層目の入力は k-1 層目の隠れ状態 h_t です。１層目を除く全ての層の入力値は、１層目と異なるshapeである可能性があることに、注意してください。

Warning

train と use_cudnn 引数はv2以降サポートされません。替わりにそれぞれchainer.using_config('train', train) とchainer.using_config('use_cudnn', use_cudnn) を使用してください。

chainer.using_config()をお読みください。

Parameters:

Parameters:	n_layers (int) – 層の数 dropout_ratio (float) – ドロップアウト率 hx (chainer.Variable) – 積層隠れ状態を保持している変数。 shape は `(S, B, N)` 、ただし`S` は層の数であり、 `n_layers`に等しい。 `B` はミニバッチサイズ、 `N` は隠れユニットの次元。 ws (list of list of chainer.Variable) – 荷重行列。`ws[i + di]` はi層目の荷重を表す。順方向RNNの `di = 0` と逆方向RNNの `di = 1` に注意。各 `ws[i + di]` は２つの行列を含むリストであり、等式においていは `ws[i + di][j]` は `di = 0` の場合の`W^{f}_j` に相当し、 `di = 1` の場合の`W^{b}_j` に相当する。`ws[0][j]` と`ws[1][j]` が`0 <= j < 1` である場合においてのみ、入力値を掛けた `(I, N)` shape。それ以外では全て `(N, N)` shape。 bs (list of list of chainer.Variable) – バイアスベクトル。 `bs[i + di]` はi層目のバイアスを表す。順方向RNNのための `di = 0` fと逆方向RNNの `di = 1` に注意。各`bs[i + di]` は２つのベクトルを含む。等式においては `bs[i + di][j]` は `di = 0` の場合の`b^{f}_j` に相当し `di = 1` の場合の `b^{b}_j` に相当する。各行列のshapeは `(N,)` 、ただし `N` は隠れユニットの次元。 xs (list of chainer.Variable) –　入力値を保持している `Variable` のリスト。各要素`xs[t]` は `t`時点の入力値を保持している。そのshape は`(B_t, I)`であり、ただし `B_t` は`t`時点のミニバッチサイズで `I` は入力ユニットのサイズ。この関数は可変長のシーケンスをサポートしているので注意。シーケンスが異なる長さの時、長さによって降順にソートしソーとされたシーケンスを転置する。 . `transpose_sequence()` シーケンスを保持している `Variable()` のリストを転置する。そのため `xs` は `xs[t].shape[0] >= xs[t + 1].shape[0]`を満たす必要がある。 activation (str) – 活性関数名。 `tanh` か `relu`を選択してください。
Returns:	この関数は３つの要素（訳注：２つ？）`hy` と `ys`を結合したタプルを返す。 `hy` は更新された隠れ状態で、shape は `hx`と同じ。 `ys` は `Variable` のリスト。各要素`ys[t]` は入力`xs[t]`.に相当する最後の層の隠れ状態を保持する。shape は `(B_t, N)` 、ただし `B_t` は `t`時点におけるミニバッチサイズ、 `N` は隠れユニットのサイズ。 `B_t` は `xs[t]`と同じ値であることに注意。
Return type:	tuple

n_layers (int) – 層の数
dropout_ratio (float) – ドロップアウト率
hx (chainer.Variable) – 積層隠れ状態を保持している変数。 shape は (S, B, N) 、ただしS は層の数であり、 n_layersに等しい。 B はミニバッチサイズ、 N は隠れユニットの次元。
ws (list of list of chainer.Variable) – 荷重行列。ws[i + di] はi層目の荷重を表す。順方向RNNの di = 0 と逆方向RNNの di = 1 に注意。各 ws[i + di] は２つの行列を含むリストであり、等式においていは ws[i + di][j] は di = 0 の場合のW^{f}_j に相当し、 di = 1 の場合のW^{b}_j に相当する。ws[0][j] とws[1][j] が0 <= j < 1 である場合においてのみ、入力値を掛けた (I, N) shape。それ以外では全て (N, N) shape。
bs (list of list of chainer.Variable) – バイアスベクトル。 bs[i + di] はi層目のバイアスを表す。順方向RNNのための di = 0 fと逆方向RNNの di = 1 に注意。各bs[i + di] は２つのベクトルを含む。等式においては bs[i + di][j] は di = 0 の場合のb^{f}_j に相当し di = 1 の場合の b^{b}_j に相当する。各行列のshapeは (N,) 、ただし N は隠れユニットの次元。
xs (list of chainer.Variable) –　入力値を保持している Variable のリスト。各要素xs[t] は t時点の入力値を保持している。そのshape は(B_t, I)であり、ただし B_t はt時点のミニバッチサイズで I は入力ユニットのサイズ。この関数は可変長のシーケンスをサポートしているので注意。シーケンスが異なる長さの時、長さによって降順にソートしソーとされたシーケンスを転置する。 . transpose_sequence() シーケンスを保持している Variable() のリストを転置する。そのため xs は xs[t].shape[0] >= xs[t + 1].shape[0]を満たす必要がある。
activation (str) – 活性関数名。 tanh か reluを選択してください。

Returns:

この関数は３つの要素（訳注：２つ？）hy と ysを結合したタプルを返す。

hy は更新された隠れ状態で、shape は hxと同じ。
ys は Variable のリスト。各要素ys[t] は入力xs[t].に相当する最後の層の隠れ状態を保持する。shape は (B_t, N) 、ただし B_t は t時点におけるミニバッチサイズ、 N は隠れユニットのサイズ。 B_t は xs[t]と同じ値であることに注意。

Return type:

tuple

chainer.functions.n_step_rnn(n_layers, dropout_ratio, hx, ws, bs, xs, activation='tanh')[source]¶

`chainer.functions.n_step_rnn`(n_layers, dropout_ratio, hx, ws, bs, xs, activation='tanh')[source]¶