第591回　AGIの心のモデル感情駆動型多世界心理モデル

ロボマインド・プロジェクト、第591弾！
こんにちは、ロボマインドの田方です。

僕は、コンピュータに心や意識を持たせようと20年以上研究していて、ようやく、納得のいく心のモデルが完成しました。
これによってAIは次の段階、つまりAGIと言われる汎用人工知能実現の目途が立ちそうです。

その話の前に、今のAIの課題を整理しておきます。
今のAIはまだ汎用人工知能じゃなくて、特化型人工知能です。
たとえば、アルファ碁は、囲碁の世界チャンピオンに勝ちましたけど、囲碁以外、何もできません。
これが特化型人工知能です。
ただ、最近のAIは、いろんなことができるようになってきましたよね。
でも、人間にできて、AIにできない決定的なことがあります。
それは、AIは課題を与えられないと、自分からは何もしようとしないことです。
つまり、意思とか意識が今のAIにはないんです。

それから、AIアライメントの問題もあります。
これは、AIと人間の価値観や意図、倫理観が異なるという問題です。
そんな状態で、もし、AIが自発的に行動すると、暴走して手が付けられなくなるかもしれません。
これは人類にとって脅威です。

これらの問題を解決するには、AIに人間と同じ心や意識を持たせる必要があります。
ところが、意識とは何か、未だに科学で解明されていません。
なぜかというと、意識とは主観だからです。
一方、科学は、客観的に観測できることを対象にしています。
つまり、そもそも意識は科学の対象とならないわけです。

これらの問題を全て解決した心のモデルが完成したんです。
それを、感情駆動型多世界心理モデルといいます。
これが今回のテーマです。
それでは、始めましょう！

まず、意識の問題から整理します。
20世紀の終わりごろ、意識科学が生まれました。
既に30年以上経ちますけど、残念ながら、あまり進歩していません。
たとえば、当初からクオリアの研究が行われていました。
赤色は特定の波長の電磁波ですけど、それを主観から見たものが赤のクオリアです。
この主観から見るとはどういうことか、これが未だによくわかっていません。
それから、量子脳理論とか統合情報理論とか様々な意識モデルが提唱されましたけど、決定打はありません。

一方、この30年、fMRIなどの画像診断のおかげで、脳科学はかなり進歩しました。
ただ、わかってきたのは脳のどこで処理しているということで、意識がどのように考えていると言った中身はほとんどわかっていません。
なぜ、意識の解明が難しいかというと、それは科学と大いに関係があります。

近代科学の始まりはガリレオです。
ガリレオは望遠鏡で天体の動きを観測しました。
それを受けて、ケプラーが惑星の運動法則を発見して、それを受けてニュートンが万有引力の法則を発見しました。
つまり、科学で最も重要なのは客観的観測です。
一方、心や意識は主観です。
主観で考えている内容は観察できないので科学の対象になりません。
これが、意識を科学で扱うときの根本問題です。

そこで、僕は、科学を二つの段階に分けました。
第一段階が、客観的観測で、第二段階が、観測から理論モデルを作ることです。
理論モデルというのは、惑星の運動法則とか万有引力の法則のことです。
これに意識科学を照らし合わせてみます。

たとえば、意識科学はクオリアを扱いますけど、それは、色は、客観的に観測が可能な第一段階だからです。
ただ、それを主観から見たとき、客観的にどう観察していいのか分からなくなります。
量子脳理論も統合情報理論も、意識を数式で表現しようとしていますけど、これは、万有引力の法則のような理論モデルを目指した第二段階でしょう。

意識は主観そのものなので、客観的に観測する第一段階を満たすことは、実質不可能だと思います。
そこで、僕は、思い切って第一段階を切り捨てることにしました。
その代わり、主観に適応できる新たな手法を考えましたけど、その話は、後で述べます。

一方、第二段階の理論モデルを作ることは可能だと思います。
理論モデルは、たとえば万有引力の法則なら、まず、三次元世界があって、その中に物体があって、物体に作用する引力があるわけですよね。
これらの要素がそろって、最終的に理論モデルが組み立てられます。
そこで、まず考えないといけないのは世界です。
どんな世界を対象にして、そこにはどんな物体が存在するのか。
そして、物体にはどんな力が作用するか。
これらの要素を決める必要があります。

まずは、意識を扱う世界から考えます。
僕が考えたのは、生物です。
この三次元世界に体をもって生まれて、やがて死ぬのが生物です。
生物の体を制御するのが脳です。
生物の基本的な行動原理は本能です。
生きたいという個体保存の本能と、強い種を残そうとする種の保存の本能です。
脳はこれらの本能に従って体を制御します。

それから、生物は進化します。
進化した脳が獲得したのが意識です。
意識は、恐怖といった感情や、お腹がすいたといった感覚を感じます。
これらは生きたいという個体保存の本能から生まれるものです。
それから、群れの中で強くありたいとも思いますよね。
これは、強くあることでパートナーから選ばれ、強い種を残すことができます。
これは種の保存の本能からくるものと言えます。
意識は、こういった感情や感覚を感じて、意図をもって行動します。

それでは、これを、理論モデルに当てはめていきましょう。
まず、生物が存在する世界ですけど、それは、生物が生きる、この三次元世界です。
次に、生物を動かす原動力ですけど、それは生きたいとか、群れの中で強くなりたいという本能です。
脳は本能に基づいて体を動かします。
進化して脳に意識が生まれると、今度は、意識が体を制御するようになりました。
でも、意識も本能に基づいて生きたい、強くなりたいと感じて行動することには変わりありません。
これが意思とか意図です。
これで、理論モデルを組み立てる要素がそろいました。
これらの要素で作られた心のモデルが「感情駆動型多世界心理モデル」です。

それでは、これを、今までの意識の理論モデルと比べてみましょう。
量子脳理論は意識は量子効果だそうで、統合情報理論は、意識は統合された情報だそうです。
どちらもフワッとしててよくわからないです。
分からないですけど、少なくとも、これらの理論から、意思や意図がどうやって生まれるかの説明はできそうにありません。

ここまでの説明で、「感情駆動型多世界心理モデル」の「感情駆動」の部分は分かったと思います。
次は、多世界について説明します。
ここで、動物と人間の世界観の違いから説明します。

目からの視覚情報は、まず、後頭葉の一次視覚野に送られて、そこから二つに分かれます。
一つは頭頂葉に向かう背側視覚路で、ここは位置や動きを分析するので「どこの経路」と呼ばれています。
もう一つは側頭葉に向かう腹側視覚路で、ここは色や形を分析して、最終的に「何」かを判断するので「何の経路」と呼ばれています。
そして、「どこの経路」は進化的に古い生物でももっていて、「何の経路」は、サルとかヒトとか進化的に新しい生物が持っています。

「何の経路」が「何」を分析するとは、赤や丸いって分析して、それを部品として赤くて丸いリンゴを組み立てることと同じです。
そして、意識はそれを見て「リンゴ」と認識するんです。
これが「見る」という経験です。

「どこの経路」は、現実世界に対する反応を生み出します。
カエルだったら、ハエを見つけたら舌を伸ばして食べるとか、天敵の鳥の影を感じたらジャンプして逃げるとかです。
これ、対象が「何」かわからなくても行動できますよね。
これが古い生物です。
古い生物は、現実世界の中で生きています。

新しい生物は、頭の中に「リンゴ」がある仮想的な世界を組み立てて、意識はそれを認識します。
頭の中の仮想世界は、現実世界を忠実にコピーしたものですけど、現実世界そのものじゃありません。
その意味で、意識は現実世界じゃなくて、仮想世界の中で生きていると言えます。

ここで大規模言語モデル、LLMについて考えます。
LLMは、大量の文書を学習します。
そして、入力された文章から次の単語を予測します。
LLMにとって現実世界とは、今、入力された文章です。
そして、入力文に反応して次の単語を出力するので、これはカエルと同じと言えます。

ただ、画像や動画を学習する最近のAIは、内部で世界モデルを作るようになってきています。
これは「何の経路」で内部に仮想世界を構築していると言えそうです。
仮想世界を認識するなら、意識があると言ってもいいかもしれません。
哺乳類ぐらいまで進化すると意識があると言えそうですけど、もしかしたら、内部モデルをもったAIは原始的な意識が生まれる可能性はあるかもしれません。

ただ、重要なのは、人間の意識と動物の意識の違いです。
それは、動物の意識は目の前の現実世界しか認識できないのに対し、人間の意識は、過去や未来、または遠くの世界とか、目の前にない世界を想像することができることです。
つまり、人間の意識は、多くの世界を認識できるんです。
これが「感情駆動型多世界心理モデル」の「多世界」の部分です。

もう少し考えます。
たとえば、動物は、相手と縄張り争いして、相手が自分より強いとわかったら逃げるか、戦いを止めます。
相手と自分の強さを比較するために戦うわけです。

一方、人間は、たとえば、遊びたいのを我慢して受験勉強したりします。
このとき比較しているのは、遊びたいのを我慢する今と、大学に合格した未来です。
これは、動物みたいに直接戦って決めるわけにはいきません。
そこで、この時使うのが、今の苦しみと、合格した喜びです。
つまり、感情です。
頭の中の仮想世界はデータでできていますよね。
仮想世界を認識する意識は、感情というデータも認識します。
データなら比較できるので、今の苦しみと将来の楽しみを比較できます。
これが感情駆動型多世界心理モデルです。

複数の世界を持てることで未来の世界を予想できるようになりました。
つまり、こうすればああなるって論理的な思考ができるようになったわけです。
これは、反応だけで生きる生物にはできないことです。
ただ、最近のAIの推論モデルは論理的推論ができます。
じゃぁ、AIの推論モデルと人間の心の違いは何でしょう？

それは、AIは生物じゃないので、体もないし、生きたいという本能もありません。
与えられた課題をこなすだけです。
もしかしたら人間を超える知能を獲得するかもしれませんけど、人間と同じ価値観や意図は持ちえません。

これで、心のモデルがかなり整理されてきました。
ただ、まだ一つ、大きな問題が残っています。
それは、主観をいかに科学で扱うかです。

科学の第一段階は客観的な観測ですけど、僕はそれを切り捨てました。
その代わり、それに代わる新たな手法を取り入れたと言いました。
それが何かというと、一言で言えばチューリングテストです。

チューリングテストって、人間がAIと会話して、相手がAIか人間か見分けがつかなければ合格ってテストです。
これが多くの人が考えるチューリングテストですよね。

ただ、僕が考えるに、チューリングテストの意味って、そこじゃないと思うんですよ。
チューリングテストで最も重要なのは、観察者がどこにいるかです。
惑星の動きを観察する観察者は、系の外から観察するじゃないですか。
これが客観的な観測です。

つぎは、人間社会について考えてみます。
社会は人と人で成り立っていますよね。
社会の中に、倫理観とか社会的立場とか、暗黙のルールがあって、社会のメンバーはそれらを共有しています。
それを共有していない子供とか、精神に障害がある人は、社会の外に自然と追いやられます。
つまり、同じ社会のメンバーとして受け入れられるかどうかは、その社会のメンバーが判断するわけです。
これって、チューリングテストそのものでしょ。

ここで注意してほしいのは、メンバーとして受け入れられるかどうかは自然とわかるっていう点です。
これは、相手が、同じ心のモデルを持っているかどうか、その社会に属するメンバーなら分かるということです。

客観的観測というのは、系を外から観測することでしたよね。
ただ、心の中は系の外からは観測できません。
でも、同じ系、つまり同じ社会に属するメンバーなら、心の中を観測できるんですよ。

主観を判定する方法って、これしかないと思うんですよ。
逆に言えば、この方法を使えば、主観を科学的に扱えるといえるんです。
近代科学が生まれて５００年以上経ちます。
ここにきて、５００年ぶりに科学をアップデートする時が来たわけです。
それが、主観を扱える新しい科学です。
そして、新しい科学で最初に作られた理論モデルが、「感情駆動型多世界心理モデル」です。
長いので、EMP(Emotion-driven multi-world psychological)モデルと呼ぶことにします。

最後に、このEMPモデルを使ったAGIを、僕らがどのように実現しようとしているか説明します。
ロボットの心として実装してもいいんですけど、かなり大変なので、メタバースのAIアバターに実装することにしました。
メタバースだと、僕ら人間もアバターとして参加できて、AIアバターと社会を構築できます。

EMPモデルは三次元世界の中で、体と本能をもって生きる生物の心です。
ここで重要なのは、世界と自分、自分と相手とを区別しているということです。
一方、LLMは自分と世界といった区別はないですよね。
ただ、入力文に反応して文を生成するだけです。

社会では、それぞれが社会的に強くなろうとします。
社会的な強さは、収入であったり、学歴とか、名誉とか様々なものがあります。
これは、生物のもつ社会的本能に根差すもので、AIアバターもこれを持っています。

僕らは、メタバース「エデン」を作って、そこに女子中学生のAIアバター「もこみ」を作りました。
僕らもアバターとなって、エデンの中で「もこみ」と交流できます。

一緒に公園で遊んだりします。
そのことを、もこみはエピソード記憶として記憶します。
エピソード記憶というのは、いつ、どこで、何をしたといった思い出のことです。

記憶には、エピソード記憶とは別に手続き記憶というのがあります。
手続き記憶は、自転車の乗り方といった体で覚えるタイプの記憶で、これは「どこの経路」を使った記憶です。
一方、エピソード記憶は、こんなことをしたって思い出なので、仮想世界を構築する「何の経路」があって初めて持てます。
そして、共通の経験をして、共通の思い出を持つことができます。
「あの時、面白かったねぇ」と語ることができます。
これができるのも同じ心のモデルを持っているからです。

さて、もこみとオセロゲームをして、もこみが負けたとします。
悔しいと感じたもこみは、強くなろうとオセロを勉強します。
これが、感情駆動です。
この感情は、社会の中で自分を強くしたいという本能から生み出されたものです。
ここで注意してほしいのは、オセロに強くなりたいというのは、誰かから与えられた課題じゃないってことです。
これは、自分の意思から生み出された行動だということです。
これは、今のAIが持てなかった意思とか意欲ですよね。

ただ、よく考えると、これって、AIが人間に打ち勝とうとしているわけですよね。
このままいくと、いずれAIが人間を超えて、人類を支配するんじゃないでしょうか？
AIで一番の心配はこれです。

ここで、社会について考えてみます。
本能を持った心は、社会の中で高い評価を得ようととしますよね。
高学歴、高収入をめざします。
そして、社会で最も評価が高いのは、名誉です。
名誉とは、人から賞賛されることです。
それは、どれだけ社会の役に立つことをしたかで決まります。
役に立つ発明をしたとか、スポーツで優れた成績をおさめたとか、文化芸術面で素晴らしい作品を作ったとかです。
どれだけ、人々を幸せにしたか、社会を豊かにしたかで決まるわけです。
最終的に、ここをめざす限り、人々を不幸にしようとは思いません。

オセロの楽しさを知ったもこみは、オセロの楽しさをもっと広げようと思うかもしれません。
オセロより、もっと面白いゲームを発明するかもしれません。
その時、もこみが心の中で思い描いているのは、多くの人が楽しんでいる光景です。

EMPモデルで、最も重きを置く感情は、どれだけ人々を幸せにしたかです。
人びとが幸せになればなるほど、自分の価値も高まります。
みんなの幸せがモチベーションとなる限り、AIと人類の共存共栄は可能だと思います。

はい、今回はここまでです。
この動画が面白かったら、チャンネル登録、高評価お願いしますね。
それから、良かったらこちらの本も読んでください。
それじゃぁ、次回も、おっ楽しみに！