いものやま。

雑多な知識の寄せ集め

強化学習とニューラルネットワークを組合せてみた。（まとめ）

技術 AI 強化学習ニューラルネットワーク HME まとめ

これまでの各記事は以下から。

イントロ
- 強化学習とニューラルネットワークを組合せ中。 - いものやま。
○×ゲームの実装
- 強化学習とニューラルネットワークを組合せてみた。（その3） - いものやま。
テーブル型Sarsa()法の実装
- 強化学習とニューラルネットワークを組合せてみた。（その4） - いものやま。
Sarsa()法で、関数近似としてニューラルネットワークを使う
- 勾配計算について
  - 強化学習とニューラルネットワークを組合せてみた。（その1） - いものやま。
- 関数近似のためのニューラルネットワークの実装
  - 強化学習とニューラルネットワークを組合せてみた。（その2） - いものやま。
- 関数近似にニューラルネットワークを使ったSarsa()法の実装
  - 強化学習とニューラルネットワークを組合せてみた。（その5） - いものやま。
- 実験
  - パラメータを変えてみる
    - 強化学習とニューラルネットワークを組合せてみた。（その6） - いものやま。
  - 中間層のユニット数を増やしてみる
    - 強化学習とニューラルネットワークを組合せてみた。（その7） - いものやま。
  - 複数のインスタンスを同時に学習してみる
    - 強化学習とニューラルネットワークを組合せてみた。（その8） - いものやま。
ドロップアウト対応
- ドロップアウト対応版ニューラルネットワークの実装
  - 強化学習とニューラルネットワークを組合せてみた。（その9） - いものやま。
- ドロップアウト対応版ニューラルネットワークを使った学習
  - 強化学習とニューラルネットワークを組合せてみた。（その10） - いものやま。
HME対応
- 関数近似にHMEを使ったときの勾配計算について
  - 強化学習とニューラルネットワークを組合せてみた。（その11） - いものやま。
- 関数近似のためのHMEの実装
  - 強化学習とニューラルネットワークを組合せてみた。（その12） - いものやま。
  - 強化学習とニューラルネットワークを組合せてみた。（その13） - いものやま。
- 関数近似にHMEを使ったSarsa()法の実装
  - 強化学習とニューラルネットワークを組合せてみた。（その14） - いものやま。
- 関数近似にHMEを使ったSarsa()法を使った学習
  - 強化学習とニューラルネットワークを組合せてみた。（その15） - いものやま。

また、関連する技術については、以下から。

強化学習とニューラルネットワークの組合せはこれで一区切り。
深層学習の勉強が進んだら、また再開するかな。

今日はここまで！