第313回 AIと人の心のアルゴリズムの違い


ロボマインド・プロジェクト、第313弾!
こんにちは、ロボマインドの田方です。

この間から、イソップ童話の「すっぱいブドウ」について考えてます。
キツネは、いくらジャンプしてもブドウに届きません。
最後に、「どうぜ、あんなブドウ、すっぱくてまずいに違いない」って捨てゼリフを吐いて去って行きます。

生きてると、こんな状況ってありますよね。
そんなとき、一緒にいて、「うん、きっとそうだよ。すっぱいに違いないよ」って言って欲しいですよね。
そんなAIを作りたいわけです。

「どうしてそんなことがわかるのですか?
 あなたは、ブドウを見ただけで、すっぱいかどうかわかるのですか?」
なんて真顔で質問してくるAIとは、うまくやっていく自信がないですよね。
でも、今のAIを推し進めると、そんなAIしか作れないんですよ。

これが今回のテーマです。
AIと人の心のアルゴリズムの違い。
それでは、始めましょう!

僕は、人と同じように考える心を作ろうとしてます。
そのために、意識は何を感じて、どんなふうに考えるかを解明する必要があります。
この心の内で感じてることを集中して考えるようにした思考実験を考えました。
それが、計器飛行の思考実験です。
計器飛行っていうのは、計器だけ見て飛行機を操縦する飛行方法です。

この思考実験で、パイロットが意識となります。
コックピットの計器が、意識が受け取るデータです。

おなかが空いたとかって検知したり、ブドウを取るにはジャンプするとかってことを提案するプログラムがあります。
これは、無意識のプログラムです。
無意識は、計算した結果をコックピットの計器に表示します。

たとえば、おなかが空いたってランプを点灯させたり、ジャンプしてブドウを取るところをモニターに表示したりするわけです。
それを見た意識は、おなかが空いたなぁって感じたり、そうだ、ジャンプしてブドウを取ろうって思いつくわけです。
意識が感じたり、思いついたりするってのは、こういうことです。

さて、ブドウを見つけたキツネは、ジャンプして取ろうとしますけど、何度ジャンプしてもブドウに届きません。
何度跳んでも届かないので、無意識プログラムは、あきらめろって提案をします。
でも、意識は、素直にあきらめる気がしません。

ここ、重要なんで、丁寧に見ていきますよ。
まず、無意識はおなかが空いたって意識に知らせます。
これは、感覚です。
無意識は、感覚や感情を意識に通知するって役割があります。

また、それとは別の役割もあります。
それは、行動の提案です。
「ジャンプしてブドウを取る」とか、「あきらめろ」とかって提案です。

ここで重要なのは、無意識からのデータを、意識は拒否したり、変更できないってことです。
おなかが空いたってデータを渡されたら、それを受け取らないってことはできないんです。
必ず受け取って、空腹として感じないわけにはいかないんです。
空腹を満腹に変更して感じるとかできないんです。

プログラムで考えれば、意識プログラムは、無意識プログラムからデータが渡されます。
そのとき、そのデータの受け取りを拒否したり、データを勝手に変更することはできないってことです。

ただし、これは感情や感覚のデータの場合です。
行動の提案の場合は、ちょっと違います。
行動の提案も、受け取りを拒否することはできませんけど、そのとおりに行動するかどうかは意識が決めれます。
つまり、提案された行動を拒否したり、提案とは違う行動をとることもできます。
ただし、これができるのは、哺乳類の意識からです。

たとえば、カエルは、目の前にハエがいて、無意識が「食べろ」って指示したら、カエルはそれを拒否できません。
ハエを捕まえる行動を止めたり、変更することはできません。

でも、犬なら、目の前にエサがあって、無意識が「食べろ」って指示しても、「マテ」と言われたら、我慢することができます。
意識が行動の提案を拒否したり、変更したりできるんです。

これは、人間も同じです。
無意識から「あきらめろ」って行動を提案されても、その提案を拒否して、あきらめずに続けることもできるんです。

今回の思考実験の意味がわかってきましたか?
無意識からどんなデータを受け取るか。
何が変更できて、何が変更できないか。
それをどう処理するのか。
そこに集中して考えることができるのがこの思考実験です。

それでは、行きますよ。
キツネは、ブドウを取るところを想像してたわけです。
前回、説明しましたけど、想像するのは想像仮想世界です。
想像仮想世界で、ブドウを取って、おいしそうに食べる自分を見たわけです。
その時の自分は、おなかも満たされて、幸せを感じてるわけです。
それを実現すべく、現実世界でジャンプするわけです。

ここで、重要なパラメーターを導入します。
それは「やる気度」です。
「やる気度」は、意識が感じるパラメータです。
そして、行動に直接作用します。

同じ行動するにしても、やる気度が高いと、進んで行動しようとします。
やる気度が低いと、いやいや行動することになります。
説明するまでもなく、「やる気」の意味は分かりますよね。
重要なのは、意味が分かるってことです。
意味が分かるってことは、あなたの意識も「やる気」を持ってて、感じることができるってことです。
自分が持ってるから意味が分かるんです。

食欲とか、性欲とかって意味は分かりますよね。
お掃除ロボット、ルンバは、食欲の意味は理解できると思うんですよ。
電池残量ランプがあって、残量が少なくなって赤く点滅すること。
これがルンバにとっての空腹です。
でも、ルンバは性欲の意味は分からないと思うんですよ。
意味がわかるってのは、対応するセンサーや仕組みがあるってことです。
だから、あなたが「やる気」の意味がわかるってことは、あなたは「やる気」を持ってるってことです。

この考えが重要なんです。
今、作ろうとしてるのは人間と同じ心です。
人間の心がもってるパラメータを同じパラメータを探そうとしてるわけです。

そして、もひとつ重要なのは、わかるっていうことは、意識が感じるパラメータだってことです。
同じパラメータでも、無意識プログラムのパラメータはわからないんですよ。
たとえば、無意識のプログラムに心臓を動かすプログラムがあるでしょう。
そのプログラムは、たぶん、血中酸素濃度に応じて心臓の動きを決めるパラメータとか持っていそうです。
でも、「うん、それ、あるある」って思わないでしょ。
そう思わないってことは、それは、意識が感じるパラメータじゃないってことです。

さて、意識の役割は行動の決定です。
どういう行動をとるかというと、損失をなるべく抑えて、得られる価値を最大にする行動です。
こういうの、AIが得意ですよね。
何らかの評価関数があって、最適なパラメータを決定するとか。

たとえば、自動運転のAIがあるとします。
カーブを曲がるときのハンドルの切り方と、ブレーキとアクセルのタイミングを決めるわけです。
コースからはみ出ずに、最も早くカーブを曲がるにはどうしたらいいかって問題です。
ハンドルの角度、ブレーキ、アクセルのタイミングのパラメータをちょっとずつ変更しながら走るんです。
そうやって、何万回って走ったら、最適なパラメータが得られます。

でも、これは実際に試せる場合です。
実際に試せないときは想像します。
想像するときに使うのが想像仮想世界のシミュレーションです。

それでは、キツネが何をシミュレーションしたか考えてみましょう。
一つは、このままジャンプをし続けること。
もう一つは、あきらめること。
目的は、最も損失を少なくし、得られるものを最大にすることです。
自分で決定できるパラメータは、あと何回跳び続けるかです。
さて、最適解を得るのに、このシミュレーションが何回必要でしょうか?
こんなの1回も必要ありません。
既に、これ以上跳んでもブドウは得られないって答えが出てます。
だから、損失を最小にするには、今すぐあきらめることです。
でも、キツネはすぐにあきらめなかったですよね。
なぜでしょう?

それは、あきらめたとき、受けるマイナス感情を避けたかったからです。
欲しいものを手に入れる自分がいるわけです。
あきらめると、その自分を否定することになるんです。
つまり失敗です。
失敗するのは絶対嫌なんです。
そのためには飛び続けるしかないんです。

こういうこと、ありますよねぇ。
あきらめて切り替えた方がいいのに、なかなかできなくてずるずる続けてしまうことです。
株とかの投資でよくあります。
株がどんどん下がって、損失が膨らみ続けてます。
損切して、損を確定すれば、それ以上の損失は免れます。
でも、もしかしたら上がるかもとかって、ずるずる続けて、余計に損失を拡大させるとか。
これといっしょです。
人って、意外と、合理的な行動がとれないんですよ。
そんな人間の心理を再現できたわけです。

さて、次は、キツネの最後のセリフです。
「あんなブドウ、どうぜすっぱくて、まずいに決まってる」です。
ここで重要なのは、このセリフをどうやって思いついたかじゃないです。
重要なのは、このセリフの意味がわかるってことです。

僕が目指してるのは、人が解けない問題を解くAIじゃないです。
そうじゃなくて、人と同じように感じる心を作ろうとしてます。

さて、キツネは悩んでます。
今の悩みは、どうやってブドウを取るかじゃないです。
これ以上続けても意味がないって答えはでてます。
ただ、それだと、失敗を認めたことになります。
敗者です。
敗者にならずに、撤退する方法を探してるわけです。

さっきも言いましたけど、無意識が生成する感情は、必ず、受け入れるしかありません。
あきらめたら、「お前は敗者だ」って感情を感じないわけにはいきません。
つまり、今、探してるのは、それを感じないで撤退する方法です。

ブドウを取るためのジャンプも、やりたくないって思ってるんです。
表向き、ジャンプしてブドウを取ろうとしてますけど、本心は、もう止めたいわけです。

そのとき、「じつは、あのブドウはすっぱくてまずい」って思いついたとします。
これを、想像仮想世界でシミュレーションしてみます。
すっぱくてまずいブドウを食べた自分と、食べない自分です。
そしたら、そんなブドウ、食べない方がメリットがありますよね。
つまり、ブドウがすっぱければ、食べない理屈が成立するんです。
自分の負けを認めるんじゃなくて、すっぱくてまずいから食べないって理屈です。

ついに、探してた解決策が見つかったわけです。
それが、「あのブドウはすっぱいに違いない」です。
本当は負けてるのに、それを認めないための理屈。

まぁ、一言でいえば、負け惜しみです。
でも、負け惜しみが理解できるって、ものすごい知能が高いって言えますよね。
人間以外の動物は理解できませんし、今のAIじゃ、絶対に理解できません。

こうして、負け惜しみを理解できる意識プログラムを作れるってとこまでできました。
さて、次は、このプログラムの意味です。
このプログラム、本当に意識といえるのでしょうか?
意識プログラムと無意識プログラムとは、根本的に何が違うんでしょう?
次回、いよいよ意識の確信に迫ります。
見逃したくない方は、チャンネル登録お願いしますね。
それから、今回の動画が面白いと思ったら、高評価もお願いします。

それと、意識の仮想世界仮説に関しては、こちらの本で詳しく語ってるので、よかったら読んでください。
それじゃぁ、次回も、おっ楽しみに!