強化学習用のニューラルネットワークをSwiftで書いてみた。（その8）

技術 AI 強化学習ニューラルネットワーク HME Swift

前回は○×ゲームをSwiftで実装した。今日はSarsaComの実装。なお、Rubyでの実装は、以下を参照： SarsaComクラスということで、さっそく。 //============================== // TicTacToe //------------------------------ // SarsaCom.swift //========…

2016-04-08

強化学習用のニューラルネットワークをSwiftで書いてみた。（その7）

技術 AI 強化学習ニューラルネットワーク HME Swift

昨日はValueNetworkの保存とロードの実装をした。（ただ、いろいろ問題があったので、後で修正する予定）これで実際に学習をするために、今日は○×ゲームをSwiftで実装する。 Markクラスまずはマークを表すMarkクラスから。 enumで実装するのも一つの手だ…

2016-04-07

強化学習用のニューラルネットワークをSwiftで書いてみた。（その6）

技術 AI 強化学習ニューラルネットワーク HME Swift

昨日は強化学習用のHMEの実装を行った。今日はそれらのデータの保存とロードが出来るようにする。 (2016-04-08追記：いろいろ問題があったので、大幅に修正する予定） NSKeyedArchiver、NSKeyedUnarchiver データをファイルに保存し、ロードする一つの方法…

2016-04-06

強化学習用のニューラルネットワークをSwiftで書いてみた。（その5）

技術 AI 強化学習ニューラルネットワーク HME Swift

昨日は強化学習用のHMEの計算を行列で表現した。今日はそれを使って実際に実装していく。なお、Rubyでの実装は、以下を参照： GateNetworkクラスまずはゲートネットワークの実装。 //============================== // ValueNetwork //-----------------…

2016-04-05

強化学習用のニューラルネットワークをSwiftで書いてみた。（その4）

技術 AI 強化学習ニューラルネットワーク HME Swift

昨日は強化学習用のニューラルネットワークの実装を行った。今日はHMEの実装を行うために、同様にHMEの計算を行列で表現していく。強化学習用のHMEの計算ここでは、HMEへの入力を、出力をとする。また、エキスパートネットワークの出力を、パラメー…

2016-04-04

強化学習用のニューラルネットワークをSwiftで書いてみた。（その3）

技術 AI 強化学習ニューラルネットワーク HME Swift

昨日は強化学習用のニューラルネットワークの計算を行列で表現した。今日はそれを使って実際に実装していく。なお、Swiftでの行列演算については、以下を参照：ここで定義したMatrixクラス、Vectorクラスを使っていくことになる。また、Rubyでの実装は以…

2016-04-03

強化学習用のニューラルネットワークをSwiftで書いてみた。（その2）

技術 AI 強化学習ニューラルネットワーク HME Swift

昨日は乱数生成器の実装を行った。今日は強化学習用のニューラルネットワークの計算を行列で表現する。強化学習用のニューラルネットワークの計算説明を簡単にするために、ここでは次のようなニューラルネットワークを考える： 3層ニューラルネットワーク…

2016-04-02

強化学習用のニューラルネットワークをSwiftで書いてみた。（その1）

技術 AI 強化学習ニューラルネットワーク HME Swift

強化学習の関数近似にニューラルネットワークを組合せるということをやってきていた。強化学習については以下から：ニューラルネットワークについては以下から：複数のニューラルネットワークを組合せるHME（Hierarchical Mixtures of Experts）について…

2016-03-22

シンギュラリティはやってくるのか。

哲学 AI 強化学習ニューラルネットワーク

AlphaGoが囲碁のトップ棋士に4-1で勝ち越したことで、にわかにシンギュラリティ（技術的特異点ーー AIが人間を超えること）が起こる真実味が増してきた、というのがある。これに関して、自分が思っていることを書いてみたい。ちなみに、シンギュラリティに…

2016-03-09

強化学習とニューラルネットワークを組合せてみた。（まとめ）

技術 AI 強化学習ニューラルネットワーク HME まとめ

これまでの各記事は以下から。イントロ強化学習とニューラルネットワークを組合せ中。 - いものやま。 ○×ゲームの実装強化学習とニューラルネットワークを組合せてみた。（その3） - いものやま。テーブル型Sarsa()法の実装強化学習とニューラルネット…

2016-03-08

強化学習とニューラルネットワークを組合せてみた。（その15）

技術 AI 強化学習ニューラルネットワーク HME Ruby

昨日は関数近似にHMEを使ったSarsa()法の実装を行った。今日はそれを使って実際に学習を行ってみる。 HMEの構成学習を行うにあたって、HMEの構成は、TD Learning of Game Evaluation Functions with Hierarchical Neural Architecturesとほぼ同じ構成にし…

2016-03-07

強化学習とニューラルネットワークを組合せてみた。（その14）

技術 AI 強化学習ニューラルネットワーク HME Ruby

昨日は関数近似のためのHMEの実装を行った。今日はいよいよHMEを関数近似に使ったSarsa()法の実装。ファイルの整理ただ、いざ実装しようと思うと、違ってくるのは関数近似の部分だけで、それ以外はまったく同じ。なので、ちょっとバカらしい感じが。そ…

2016-03-06

強化学習とニューラルネットワークを組合せてみた。（その13）

技術 AI 強化学習ニューラルネットワーク HME Ruby

昨日はゲートネットワークの実装を行った。今日はそれを使って関数近似のためのHMEの実装を行う。 ValueHMEクラス関数近似のためのHMEをValueHMEクラスとして実装していく。 #==================== # value_hme.rb #-------------------- # 価値ベクトルを…

2016-03-05

強化学習とニューラルネットワークを組合せてみた。（その12）

技術 AI 強化学習ニューラルネットワーク HME Ruby

昨日はHMEを強化学習の関数近似に使うときの勾配計算について説明した。今日からは実際にRubyで実装を進めていく。まずはゲートネットワークの実装から。 GateNNクラスゲートネットワークをGateNNクラスとして実装していく。 #==================== # gat…

2016-03-04

強化学習とニューラルネットワークを組合せてみた。（その11）

技術 AI 強化学習ニューラルネットワーク HME

前回はドロップアウトを実装したニューラルネットワークを強化学習の関数近似に使う実験をした。けど、結果としてはうまくいかなかった。そこで、次はHMEを強化学習の関数近似に使うのを試してみる。 HMEについては、以下を参照： HMEの出力の重みに関する…

2016-03-03

HMEについて学んでみた。（まとめ）

技術 AI ニューラルネットワーク HME

これまでの各記事は以下から。 HMEの構造と出力の計算 HMEについて学んでみた。（その1） - いものやま。 HMEでの学習 HMEについて学んでみた。（その2） - いものやま。 HMEの出した結果 HMEについて学んでみた。（その3） - いものやま。 HMEの構造 HMEは…

2016-03-02

HMEについて学んでみた。（その3）

技術 AI ニューラルネットワーク HME

昨日はHMEでの学習について説明した。これでHMEについての説明自体は終わりなんだけど、せっかくなので、論文内で言及されているHMEの成果についても。参照している論文は、以下のもの： TD Learning of Game Evaluation Functions with Hierarchical Neur…

2016-03-01

HMEについて学んでみた。（その2）

技術 AI ニューラルネットワーク HME

昨日はHMEの構造と出力の計算について説明した。今日はHMEでの学習について説明する。 HMEでの学習 HMEでの学習は、HMEを一種の混合分布モデルとみなして、尤度が最大になるように学習を行う。・・・ということみたいなんだけど、これをまだ自分がちゃんと…

2016-02-29

HMEについて学んでみた。（その1）

技術 AI ニューラルネットワーク HME

○×ゲームに対して、強化学習にニューラルネットワークを組み合わせるということをやってきた。その中で、複数のインスタンスを同時に学習していくのは、ある程度有効だということが分かった。ただし、それらの結果を組み合わせる方法が必要という話になっ…

2016-02-24

強化学習とニューラルネットワークを組合せてみた。（その10）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日はドロップアウトの実装を行った。今日はそれで実際に学習を行ってみた。中間層のユニット数: 128、ドロップさせるユニット数: 32 まず、中間層のユニット数を128、ドロップさせるユニット数を32にして、1,000,000回、2,000,000回、3,000,000回、学習…

2016-02-23

強化学習とニューラルネットワークを組合せてみた。（その9）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日は複数のインスタンスを同時に学習するということを試してみた。これ自体は有効に思われ、あとは複数のインスタンスの出す結果をどうやって統合するのかが課題になった。その方法の一つとして考えられる、ドロップアウトの実装を行ってみた。なお、ド…

2016-02-22

強化学習とニューラルネットワークを組合せてみた。（その8）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日は中間層のユニット数を増やす実験をしてみた。大体うまく動いていたけど、そこで出た課題として、自己対戦だと局所的な戦略に特化してしまって、他の場面に出くわしたときにうまく動けないことが多いようだった。そこで、複数のインスタンスを用意し…

2016-02-21

強化学習とニューラルネットワークを組合せてみた。（その7）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日はパラメータをいろいろ変える実験をやってみた。結論から言えば、そもそも学習がうまくいっていない感じだった。そして、論文をちょっと調べてみると、○×ゲームに対して関数近似にニューラルネットワーク（+α）を使うものだと、中間層のユニット数に8…

2016-02-20

強化学習とニューラルネットワークを組合せてみた。（その6）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日は関数近似にニューラルネットワークを使ったSarsa()法を実装してみた。けど、うまくいかなかったので、いろいろパラメータを変えてみるということをやってみた。パラメータテストパラメータとして調整しないといけないものは、次の4つ：中間層のユ…

2016-02-19

強化学習とニューラルネットワークを組合せてみた。（その5）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日はテーブル型のSarsa()法の実装を行った。今日はいよいよ関数近似にニューラルネットワークを使ったSarsa()法の実装してみる。 NNSarsaComクラス関数近似にニューラルネットワークを使ったSarsa()法のクラスは、NNSarsaComクラスとした。 #===========…

2016-02-18

強化学習とニューラルネットワークを組合せてみた。（その4）

技術 AI 強化学習ニューラルネットワーク Ruby

昨日は○×ゲームを人がプレイできるようにするところまで実装した。今日はテーブル型のSarsa()法を実装する。 SarsaComクラスということで、さっそく。 #==================== # sarsa_com.rb #-------------------- # テーブル型のSarsa(λ) AI #==========…