いものやま。

雑多な知識の寄せ集め

2016-01-10から1日間の記事一覧

強化学習について学んでみた。(その31)

昨日は、関数近似を組合せる方法が、従来のテーブル型の拡張になっていることを確認した。 今日は、関数近似の1つである、線形手法について説明する。 線形手法 線形手法では、線形関数を使って、価値ベクトルを近似する。 といっても、状態や状態行動対はの…