chainer.functions.n_step_birnn

`chainer.functions.n_step_birnn`(n_layers, dropout_ratio, hx, ws, bs, xs, activation='tanh')[source]¶

シーケンス入力のための積層型双方向（Bi-dimensional）RNN関数。

この関数はシーケンス入力のための積層型双方向（Bi-dimensional）RNN関数を演算します。隠れ状態の初期値 $h_{0}$ 、セル状態の初期値 $c_{0}$ 、入力シーケンス $x$ 、荷重行列 $W$ 、バイアスベクトル $b$ . を取得します。また、各時間 $t$ において、入力 $x_{t}$ から隠れ状態 $h_{t}$ と $c_{t}$ を計算します。

h f t h b t h t = = = f (W f 0 x t + W f 1 h t - 1 + b f 0 + b f 1), f (W b 0 x t + W b 1 h t - 1 + b b 0 + b b 1), [h f t; h f t],

ただし $f$ は活性関数。

荷重行列 $W$ は2つの行列 $W^{f}$ と $W^{b}$ を含みます。 $W^{f}$ は順方向のRNNの荷重行列です。 $W^{b}$ 逆方向のRNNの荷重行列です。

$W^{f}$ は入力シーケンスのための $W_{0}^{f}$ と隠れ状態のための $W_{1}^{f}$ を含みます。 $W^{b}$ は入力シーケンスのための $W_{0}^{b}$ と隠れ状態のための $W_{1}^{b}$ を含みます。

バイアス行列 $b$ は２つの行列 $b^{f}$ と $b^{f}$ を含みます。 $b^{f}$ は入力シーケンスのための $b_{0}^{f}$ と隠れ状態のための $b_{1}^{f}$ を含みます。 $b^{b}$ は入力シーケンスのための $b_{0}^{b}$ と隠れ状態のための $b_{1}^{b}$ を含みます。

この関数はシーケンスを受容するので、全ての $t$ における $h_{t}$ を一度の呼び出しで計算します。２つの荷重行列と２つのバイアスベクトルは各層について必要になります。ですから $S$ 層が存在する場合、 $2 S$ 個の荷重行列と $2 S$ 個のバイアスベクトルを用意する必要があります。

層の数 n_layers が $1$ より大きい場合、 k層目の入力は k-1層目の隠れ状態h_t です。１層目を除く全ての層の入力値は、１層目と異なるshapeである可能性があることに、注意してください。

Warning

train と use_cudnn 引数はv2以降サポートされません。替わりにそれぞれchainer.using_config('train', train) とchainer.using_config('use_cudnn', use_cudnn) を使用してください。

chainer.using_config()をお読みください。

Parameters:

Parameters:	n_layers (int) – 層の数 dropout_ratio (float) – ドロップアウト率 hx (chainer.Variable) – 積層隠れ状態を保持している変数。 shape は `(S, B, N)` 、ただし`S` は層の数であり、 `n_layers`に等しい。 `B` はミニバッチサイズ、 `N` は隠れユニットの次元。 ws (list of list of chainer.Variable) – 荷重行列。`ws[i + di]` はi層目の荷重を表す。順方向RNNの `di = 0` と逆方向RNNの `di = 1` に注意。各 `ws[i + di]` は２つの行列を含むリストであり、等式においていは `ws[i + di][j]` は `di = 0` の場合の`W^{f}_j` に相当し、 `di = 1` の場合の`W^{b}_j` に相当する。`ws[0][j]` と`ws[1][j]` が`0 <= j < 1` である場合においてのみ、入力値を掛けた `(I, N)` shape。それ以外では全て `(N, N)` shape。 bs (list of list of chainer.Variable) – バイアスベクトル。 `bs[i + di]` はi層目のバイアスを表す。順方向RNNのための `di = 0` fと逆方向RNNの `di = 1` に注意。各`bs[i + di]` は２つのベクトルを含む。等式においては `bs[i + di][j]` は `di = 0` の場合の`b^{f}_j` に相当し `di = 1` の場合の `b^{b}_j` に相当する。各行列のshapeは `(N,)` 、ただし `N` は隠れユニットの次元。 xs (list of chainer.Variable) –　入力値を保持している `Variable` のリスト。各要素`xs[t]` は `t`時点の入力値を保持している。そのshape は`(B_t, I)`であり、ただし `B_t` は`t`時点のミニバッチサイズで `I` は入力ユニットのサイズ。この関数は可変長のシーケンスをサポートしているので注意。シーケンスが異なる長さの時、長さによって降順にソートしソーとされたシーケンスを転置する。 . `transpose_sequence()` シーケンスを保持している `Variable()` のリストを転置する。そのため `xs` は `xs[t].shape[0] >= xs[t + 1].shape[0]`を満たす必要がある。 activation (str) – 活性関数名。 `tanh` か `relu`を選択してください。
Returns:	この関数は３つの要素（訳注：２つ？）`hy` と `ys`を結合したタプルを返す。 `hy` は更新された隠れ状態で、shape は `hx`と同じ。 `ys` は `Variable` のリスト。各要素`ys[t]` は入力`xs[t]`.に相当する最後の層の隠れ状態を保持する。shape は `(B_t, N)` 、ただし `B_t` は `t`時点におけるミニバッチサイズ、 `N` は隠れユニットのサイズ。 `B_t` は `xs[t]`と同じ値であることに注意。
Return type:	tuple

n_layers (int) – 層の数
dropout_ratio (float) – ドロップアウト率
hx (chainer.Variable) – 積層隠れ状態を保持している変数。 shape は (S, B, N) 、ただしS は層の数であり、 n_layersに等しい。 B はミニバッチサイズ、 N は隠れユニットの次元。
ws (list of list of chainer.Variable) – 荷重行列。ws[i + di] はi層目の荷重を表す。順方向RNNの di = 0 と逆方向RNNの di = 1 に注意。各 ws[i + di] は２つの行列を含むリストであり、等式においていは ws[i + di][j] は di = 0 の場合のW^{f}_j に相当し、 di = 1 の場合のW^{b}_j に相当する。ws[0][j] とws[1][j] が0 <= j < 1 である場合においてのみ、入力値を掛けた (I, N) shape。それ以外では全て (N, N) shape。
bs (list of list of chainer.Variable) – バイアスベクトル。 bs[i + di] はi層目のバイアスを表す。順方向RNNのための di = 0 fと逆方向RNNの di = 1 に注意。各bs[i + di] は２つのベクトルを含む。等式においては bs[i + di][j] は di = 0 の場合のb^{f}_j に相当し di = 1 の場合の b^{b}_j に相当する。各行列のshapeは (N,) 、ただし N は隠れユニットの次元。
xs (list of chainer.Variable) –　入力値を保持している Variable のリスト。各要素xs[t] は t時点の入力値を保持している。そのshape は(B_t, I)であり、ただし B_t はt時点のミニバッチサイズで I は入力ユニットのサイズ。この関数は可変長のシーケンスをサポートしているので注意。シーケンスが異なる長さの時、長さによって降順にソートしソーとされたシーケンスを転置する。 . transpose_sequence() シーケンスを保持している Variable() のリストを転置する。そのため xs は xs[t].shape[0] >= xs[t + 1].shape[0]を満たす必要がある。
activation (str) – 活性関数名。 tanh か reluを選択してください。

Returns:

この関数は３つの要素（訳注：２つ？）hy と ysを結合したタプルを返す。

hy は更新された隠れ状態で、shape は hxと同じ。
ys は Variable のリスト。各要素ys[t] は入力xs[t].に相当する最後の層の隠れ状態を保持する。shape は (B_t, N) 、ただし B_t は t時点におけるミニバッチサイズ、 N は隠れユニットのサイズ。 B_t は xs[t]と同じ値であることに注意。

Return type:

tuple

chainer.functions.n_step_birnn(n_layers, dropout_ratio, hx, ws, bs, xs, activation='tanh')[source]¶

`chainer.functions.n_step_birnn`(n_layers, dropout_ratio, hx, ws, bs, xs, activation='tanh')[source]¶