いものやま。

雑多な知識の寄せ集め

「BirdHead」の思考ルーチンを作ってみた。(まとめ)

これまでの各記事は以下から。

強化学習の手法として使ったSarsa( \lambda)法、関数近似については、まだ記事を書いていないので、そのうち書いたらリンクを・・・

強化学習自体については、以下の一連の記事を参照。

特に、Sarsa( \lambda)法と関連の深い、モンテカルロ法(方策オン型モンテカルロ制御)、Sarsa法については、以下を参照。

これで思考ルーチンも合わせてモデルの部分はほぼ完成なので、次はUIを作っていく予定。

今日はここまで!