これまでの各記事は以下から。
- イントロ
- ○×ゲームの実装
- テーブル型Sarsa()法の実装
- Sarsa()法で、関数近似としてニューラルネットワークを使う
- 勾配計算について
- 関数近似のためのニューラルネットワークの実装
- 関数近似にニューラルネットワークを使ったSarsa()法の実装
- 実験
- パラメータを変えてみる
- 中間層のユニット数を増やしてみる
- 複数のインスタンスを同時に学習してみる
- ドロップアウト対応
- HME対応
また、関連する技術については、以下から。
- 強化学習
- ニューラルネットワーク
- HME
強化学習とニューラルネットワークの組合せはこれで一区切り。
深層学習の勉強が進んだら、また再開するかな。
今日はここまで!