GRU (Gated Recurrent Unit)とは【わかりやすく】

こちらもおすすめ

【2022年1月最新:全部受講】Udemyのおすすめ31選をカテゴリ別に紹介【データサイエンス/機械学習,Python/R/SQLプログラミング】 | Quant College

【初心者から上級者まで】Pythonプログラミング独学におすすめの本6選 (難易度順)【感想あり】 | Quant College

【感想あり】C++プログラミングの独学におすすめの本4選【金融工学徒向け】 | Quant College

GRUの数式

GRUのWikipediaの数式を直感的に理解する。

各変数の直感的な意味

変数\(x\)は新たに入ってきたインプットである。
各種\(W\)と\(b\)はモデルのパラメーターであり、\(W\)はウェイト、\(b\)はバイアスである。

その他が重要な変数である。
3つの変数\(z, r, h\)の直感的な意味は次の通り。

  1. \(z\): 更新ゲート(upgate gate)
    一時点前の隠れ層である\(h\)の情報のうち、いらないものをどれくらい忘れるかを表す。つまり古い情報をどれくらい捨てるかを表す。\(z\)は0と1の間の値をとるが、\(z\)が大きいほど、古い情報をたくさん捨てることになる。
  2. \(r\): 初期化ゲート(reset gate)(resetのr)
    隠れ層\(h_t \)を更新する際に、一時点前の隠れ層\(h_{t-1}\)の情報をどれくらい引き継ぐかを表す。\(r\)が大きいほど、過去の情報が多く引き継がれる。
  3. \(h\): 隠れ層(hiddenのh)
    過去から引き継がれてきた記憶(文脈)を表す。\(h_t\)は、一時点前の隠れ層\(h_{t-1}\)と、直近で新しく入ってきた情報から作られた情報(ここで\(r\)が使われる)を、\(1-z_t \)と\(z_t\)の割合で混合して作られる。

3本の数式の直観的な意味

以上を踏まえて3本の数式の意味を直感的に理解する。

  1. 1本目の式の\(\sigma_g \)は、シグモイド関数なので0から1までの値をとる。\(z\)が1に近いほど、3本目の式で\(h_t\)を求める際に\(h_{t-1}\)の影響を受けなくなる。つまり、\(z\)が1に近いほど、\(h_t\)が直近の文脈の影響を受けなくなり、今までの記憶を忘れて大きく更新することになる。このように\(z\)は記憶を更新する度合いを表している。
  2. 2本目の式の\(r\)は、シグモイド関数なので0から1までの値をとる。1に近いほど過去の記憶\(h_{t-1}\)を将来に引き継ぐ0に近いほど過去の記憶をリセットして、直近に入ってきたインプット\(x\)を重視して覚えておく。
  3. 3本目の式の\(h\)は、長期記憶を表す。なぜ長期記憶かというと、一時点前の\(h_{t-1}\)をもとに\(h_t\)が作られており、過去の自分自身が将来に受け継がれているからである。過去の情報が累積されているので長期的に残している記憶に対応する。
    1. 3本目の \(h\) の式は、前半過去の情報の一部を忘れずに引き継ぐことを表しており、後半新しく入ってきた情報の一部を長期記憶に残しておくことを表している

あわせて読みたい

LSTMとは【わかりやすく】 | Quant College

再現率/適合率とは?違い/覚え方【わかりやすく】 | Quant College

第一種過誤/第二種過誤とは?違いと覚え方をわかりやすく | Quant College

主成分分析と因子分析の違いと使い分け【わかりやすく】 | Quant College

【簡単にわかりやすく】棄却サンプリングとは【乱数生成方法】 | Quant College

『ゼロから作るDeep Learning 3』のコードを全て読んでみた(1) | Quant College

ディープヘッジングとは | Quant College

ディープヘッジングの概要 | Quant College

【論文紹介】ニューラルネットワークのオプション評価への応用【サーベイ論文の翻訳】 | Quant College

こちらもおすすめ

【2022年1月最新:全部受講】Udemyのおすすめ31選をカテゴリ別に紹介【データサイエンス/機械学習,Python/R/SQLプログラミング】 | Quant College

【初心者から上級者まで】Pythonプログラミング独学におすすめの本6選 (難易度順)【感想あり】 | Quant College

【感想あり】C++プログラミングの独学におすすめの本4選【金融工学徒向け】 | Quant College