いものやま。

雑多な知識の寄せ集め

2016-01-08から1日間の記事一覧

強化学習について学んでみた。(その29)

昨日は関数近似の説明をするための準備を行った。 今日は関数近似を強化学習とどのように組合せていくのか説明する。 関数近似による価値ベクトルの表現 強化学習に関数近似を組合せる場合、状態価値ベクトルや行動価値ベクトルを、パラメータをもった関数で…