人工知能に「身体性」が必要なわけ。

昨日の記事で、最後に次のようなことを書いた。

もっとも、今の考えとはちょっと違っていて、AIとの関連から身体性については述べていたんだけど。
具体的には、AIを開発したとしても、そのAIが自身の感情や行動を表現したり、あるいは他から影響を受けたりするためには、身体がないとダメだよね、という感じ。

これに関して、もうちょい補足が必要かな、と思ったので、今日はそれについて書きたい。

なお、以下の文章は、やはり自分が昔ブログに書いた記事（を少し修正したもの）で、そのときのタイトルは「情報場。」というもの。
この「情報場」というのは、『飾られた記号』というラノベに出てくる概念なんだけど、（このラノベが面白いかは別として）非常に面白い概念で、人工知能に「身体性」を持たせるための一つの方法として使えそうと考えてた。

飾られた記号―The Last Object (電撃文庫)

作者: 佐竹彬,千野えなが
出版社/メーカー: メディアワークス
発売日: 2005/06
メディア: 文庫
クリック: 31回
この商品を含むブログ (50件) を見る

その是非は置いておくとしても、以下の文章を読めば、どうして人工知能に「身体性」が必要なのかが分かるかと思う。

ちなみに、書いたのは2005年の10月25日。

人工知能のモデルにおける「情報場」という概念の導入について。

「情報場」といえば、『飾られた記号』に出てきたあくまで空想的なものなわけだけど、この概念が実は人工知能に身体性を与えるにすごく便利なものなんじゃないかなぁ、と。

話を順序だてて説明するのが難しいんだけど、まぁ端的に言ってしまえば人工知能のモデルについて考えていたわけ。
んで、人工知能が知能と呼べるものを持っているのかを調べるには、やはり言語を使えるかどうか、というのが大きい。

となれば、人間と同じように言葉を話せるようにしよう、これが普通の目的となる。（これは人工無脳と同じレベル。）
ただし、これだと「中国語の部屋」の問題が出てくる。

重要なのは、

言語は確かにある規則によって繋げられた記号列にすぎない
けれど、それは現実においてなんらかしらの現象を指し示している

ということ。

1.に注目したのが人工無脳などの考え方で、ようは記号自体に意味はないし、コンピュータも理解していないのだけれど、重要なのは「どういったパターンで使用されるのか」ということに気をつけて記号運用さえしていけば、その記号の運用のされ方から、「人間には」その記号から意味が汲み取れて、かつコンピュータも言葉を理解しているように見える、といったもの。
これはヒルベルトの形式主義にも現れていて、例えば∧, ∨, ￢, ⇒などの記号「それ自体」は定義のしようがない。
けど、その記号の使われ方から、それらの記号にある「意味」を付加して人間はそれを読んでいくことが出来る、と。

ただし、これでは到底言葉を「理解している」とは言えない。
というのも、「言葉の使い方」は知っているのだけれど、じゃあ「その言葉がどういったことを指し示しているのか」は理解できないから。
つまり、2.のレベルでの言語理解が出来ない。

そこで、自分が考えたのは、「言葉が何を指し示しているのか」というものを、オブジェクトの属性によってコンピュータに教えてやる、というもの。
例えば「リンゴ」であれば、「赤い」「丸い」「食べ物」「果物」「直径10cmくらい」「おいしい」etc...
で、じゃあそういった「赤い」などの属性をコンピュータにどう教えるのか、となると、今度は逆に「リンゴ」「太陽」「血」とか、名詞の集合に共通するものとし、相互補完的に示して、そこから言語をどう使っていけばいいのかと言語の指し示すものをコンピュータに教えていけるんじゃないかなぁ、と。

（補足）つまり、「単語」間の関係性（構造）を人工知能に教えることで、その関係性から人工知能が2.のレベルでの言語理解を得られることを目指した。

けれど、これもダメなことが分かる。
というのも、初めて見た（知った・聞いた）もの（もの、あるいは記号、オブジェクト）に対して、「教わる」以外に「知る」というすべがないから。
結局、言葉を言葉で定義しても、言葉の間の関係や構造をつかむことは出来ても、その言葉の指し示すもの「それ自体」を捉えることは出来ない。
そして、初めて見たものを「自分の力で」分類し、既存の言語構造（単語間の関係の構造）の中に取り入れることが出来ない。

（補足）これが「関係性」によって言語を理解しようとした場合の限界、ということ。辞書だけをどんなに調べていても、「リンゴ」という単語の指し示すものが、自分たちの知っているあの「リンゴ」であるということを、理解出来ない。

結局、「言語で表されていない『それ自身』」に触れ、見て、こういうものなんだ、という「実感」を持った上でーーつまり、まず「身体性」があった上でーーじゃあ、それがなんと呼ばれるものなのか、その感触、色、味、においなどがなんと呼ばれるものなのか、という「名前」が与えられるのでなければ、言語が「何か」を指し示すものである、ということは伝わらない。
（なんかヘレン・ケラーの話を思い出すよね）

〜〜〜

そもそも、人工知能に「身体性」が必要そうだということは以前から考えていたことで、結局「言葉遊び」に至らないためには、現実の空間とは違う形でもいいから、なんらかしらの「空間」を与えて、そのなかでさらに人工知能に「身体性」を与えてやらなきゃいけないんだろうなぁ、と。
んで、３次元空間を擬似的とはいえ表現するのは大変だろうから、ループ状の１次元空間とかがまずはいいのかなぁ、とか考えてた。（与えられる身体性はミミズとかに近いものになりそう？）

けれど、この「身体性を与えなきゃ」という考えをしていたところで、じゃあどうやってその「感覚」を伝えるのか、それが問題だと気がついたり。

そこで、さっきの言語による相互補完的な定義によって「意味」を与える、という考えが出てきて、空間内にオブジェクトを設置し、それを見たり触れたりする（＝アクセスする）ことでオブジェクトの「内部」に隠されていた「属性」が取得できるようにすればいいんじゃないのか、というのが最初の考え。
たとえば「リンゴ」に対して「見る」という行為を行えば、「赤い」とか「丸い」という属性が取得できる、と。
けれど、じゃあその「赤い」とか「丸い」というのがどういったものなのかまでは分からない。そこで、いろいろなものにアクセスすることで、それらの関係性から抽象的にそれらの意味が知れるようになるんじゃないかな、と。（つまり、「リンゴ」は様々な属性の集まりによって定義され、各属性はその含まれ方から概念的に抽出される、と）

ただ、このアプローチで困るのが「感情」。
　リンゴを食べる→おいしい（という属性が得られる）
ここまではいいんだけど（本当は不十分なんだけど）、
　おいしい→うれしい
このプロセスがこれでは得られない。
もちろん、事前に“おいしい→うれしい”なんだよ、と教えてあげればそれでいいようにみえるけど、これは「こういう属性に対して抱く感情はこうなんだよ」と結局「言葉」によって定義してしまっているにすぎず、そこに身体性はない。
確かに、おいしかったらうれしい、というそのパターンは覚えられるかもしれないけど、じゃあその「うれしい」というのが「どういう状態なのか」が「身体」から得られたものではなく、「パターンとして与えられたもの」でしかなくなってしまう。

でも、上の議論から見えてくるのは、すなわちそういった感情というものは「身体の変化」から得られるようにすればいい、ということ。
なので、オブジェクトにアクセスしたときに必要となるのは、オブジェクトの属性という「言葉」ではなく、「オブジェクトが『身体』に与える影響値」となる。
そして、人工知能はその影響値のパターンそれ自体に「名前」を与えていけばいい、と。
例えば「リンゴ」というものに対して「食べる」というアクセスを行った場合、「身体」の味覚のパラメータに＋の影響を与え、さらにそのパラメータが今度は感情のパラメータに＋の影響を与える、といった具合。（実際にはもっと細かい感覚の分類と感情の分類が必要だけど）

ここで注目したいのが、「リンゴ」はその内部に「身体に対してどのように影響するのか」というメソッドを「内包している」ということ。
見られたら、視覚に対して変化を起こさせるメソッド、触られたら、その固さの具合、滑らかさ、形を伝えるメソッド、匂いをかがれれば嗅覚に変化を与えるメソッド、etc...
それらすべてがリンゴに内包されていることになる。
というよりも、上のような変化を与えるメソッドの集まりそれ自身がリンゴと呼ばれるものなんだ、ということも出来る。
これって、まんま「情報場」の考え方だよね？

（補足）作品における「情報場」がどういうものかというと、空間には「情報」が詰まった多次元ベクトルが存在し（これが「情報場」で、「電場」や「磁場」と同様に考えるといい）、物体というのはその情報場の表れとして現れる、としている。物体の情報を得るというのは、情報場の多次元ベクトルの一成分を取得してることになるし、作品中では、多次元ベクトル自体を操作して物体を変化させるということもやってたはず。（今手元にないので、ちゃんと確認出来ない・・・）

オブジェクトはまず情報場（と呼んでしまいましょう）にアクセスされることで身体に変化を与える。
んで、今度はその身体の変化が思考に影響を与える。
そうすると、そのパターンというものに対して思考が各々に名前を与えていくことが出来るようになる。
そうすることで、身体性の伴った2.のレベルでの言語理解が可能になる、と。

いっそのこと、空間における座標それ自体にメソッドの集まりーーつまり情報場ーーを定義してしまえば、身体性を備えた人工知能というものを作ることが出来るんじゃないかなぁ、と。

なお、上のでモデルで未だ解決しないものがあって、それは「欲」をどう表現するのか、ということ。
もちろん身体自体に本能として「ある状態を目指す」というのがプログラムされていればいいんだろうけれど、その場合「道徳」的な行動をしよう、という「欲」（つまり、身体性というよりは社会性によって生まれてくる「欲」）をどうやって「身体」に覚えこますのか、という問題が出てくる。
考えているのは、状況からの学習によって「言葉」自体に情報場的な役割が生まれるようになってきて、「ほめられる」という行為が身体的な喜びと繋がってくるようなモデルが作れればいいのかなぁ、と。

同じことが二度繰り返されて言われてる（一回目は哲学的な観点、二回目は実装的な観点）のと、「身体性」という言葉が2つのレベルで使われているので、ちょっと分かりにくくなってるけど、要約すると、

人工知能がただの「言葉遊び」で終わらないようにするためには、人工知能が「外部」から影響を受け、「外部」へ影響を与えるような「身体」が必要。（「インタフェース」としての「身体」の存在の必要性）
外部からの影響を受け取るときに、オブジェクトから「属性」（＝言葉）を受け取って、それらの「属性」の関係性から、言葉の意味を理解することを考えた。（言葉同士の「関係性」による言葉の理解）
2.の方法だと、「言葉」と「それ自体」を結びつけることが出来ない。（前半で述べた、関係性による理解の限界）
また、「言葉」と「感情」を結びつけることが出来ない。（後半で述べた、関係性による実装の限界）
3.の理由から、オブジェクトからの影響は「身体の変化」として現れないといけない。（オブジェクトと身体の間でやり取りされるされるものは、「言葉」ではなく「身体の感覚」でないといけないという意味での、「身体性」の必要性）

という感じ。

うーん、伝わったかな？（＾＾；

今日はここまで！

いものやま。

雑多な知識の寄せ集め

人工知能に「身体性」が必要なわけ。