昨日は関数近似の説明をするための準備を行った。 今日は関数近似を強化学習とどのように組合せていくのか説明する。 関数近似による価値ベクトルの表現 強化学習に関数近似を組合せる場合、状態価値ベクトルや行動価値ベクトルを、パラメータをもった関数で…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。