第26回　ＡＩが話す言葉が、ついに心に辿り着きました　〜AI　記号から言葉へ

ロボマインド・プロジェクト、第２６弾
こんにちは、ロボマインドの田方です。

このシリーズ、最初から見てた人は分かると思いますが、相手の言いたいことを理解するとは心理パターンを見つけることと同じです。

心理パターンというのは、第１３回で詳しく説明しましたが、簡単に説明すると、嬉しいとか悲しいとかって感情や、感謝や善悪といった人間の心理のことです。

子供が、お母さんに「今日、こんなことがあったよ」と言ったとします。
そこで言いたいのは、こんな嬉しいことがあったよとか、こんな腹立つことがあったよいった感情なわけです。
これが心理パターンです。

たとえば、感謝の心理パターンについて考えてみましょう。
人から、プレゼントをもらったとします。
このとき、相手に感謝の心理パターンが発生します。

価値のあるものが手に入ったわけです。
そうすると、まずは、嬉しいという心理パターンが発生します。
これは、人間でなくても、犬とか動物でも持ってる心理パターンです。

感謝は、プレゼントをくれたのが相手だと認識しないといけません。
もっと言えば、相手がプレゼントを自分にくれたという状況を認識できないといけません。
相手、プレゼント、自分という関係を客観的に認識しないといけないわけなんです。
これって、意外と難しんです。

どこが難しいかと言うと、客観的に自分を見るってとこです。
相手や、プレゼントは、目で見て確認できるので、客観的に認識できますよね。
でも、自分って、自分じゃみえないですよね。
どんだけ見渡しても、自分は見えないです。
これじゃ、客観的に自分を認識できないじゃないですか。

まずは、この問題から解決します。
以前話したエピソード記憶のことは覚えていますか？
第２３回「人工知能が思い出を語り始めた」のことです。
簡単に説明すると、自分の中学の卒業式を思い出してみます。
講堂や体育館での卒業式です。
おそらく、上から俯瞰して卒業式を見てる光景を思い出しますよね。
でも、よく考えたら、そんな位置から卒業式を見てたわけじゃないですよね。
もっとおかしいのは、そうやって見てる中に、自分もいるわけです。

そうなんです。
客観的に自分をみてるんですよ。

そして、人は、それを自然にやってるんです。
自分を客観的に感じるってこと。
これを自然とやってるんですよね。

別の例で説明します。
たとえば３ＤＣＧのゲームです。
ゲームで、キャラクターの見せ方は、一人称視点と三人称視点があります。
キャラクターが見てる光景を、そのまま見せるのが一人称視点です。
キャラクターの少し後ろから、キャラクターの後ろ姿を見下ろしながら全体を見渡せるのが三人称視点です。

一人称視点は分かるのですが、三人称視点でも違和感なくプレイできるって、よく考えたら不思議です。
普段、自分を後ろから見ることなんかないはずですし。

これが、違和感なくプレイできるってことは、人間は、内部的にそういう視点で物を見ているってことなんです。
客観的に自分を観察するって機能を持っているってことです。

もちろん、実際に自分の後ろ姿を見てるわけじゃないですから、後ろから見た髪型がどうかとか、そんなことは分からないです。
そうじゃなくて、自分が他人からどう見られてるかというのを、自然と感じながら暮らしているということです。

さて、それでは、その機能はどうやったら生まれるのでしょうか？
それは、今まで何度も説明してきた想像仮想世界を使うわけです。
自由に世界そのものを想像できる仕組みです。
記憶にある卒業式の光景を想像仮想世界に再構築するわけです。
意識は、再構築した世界を眺めるわけです。
これができるから、卒業式を思い出したとき、俯瞰的に全体を見下ろすことができるわけなんです。

想像仮想世界の特徴は、目で見える光景を作るだけじゃなくて、見えないところまで作れることです。
目に見えるのは、３次元世界です。
でも、世界は、３次元世界だけじゃないんです。

じつは、世界は、複数あるんです。
前回、第２５回「ＡＩ　人間　言語を再定義」では、所有権世界の例を取り上げました。
３次元世界とは別に存在する所有権世界です。

何か物をあげる場合、目で見えて、手で渡す部分は３次元世界で行われてることです。
でも、「あげる」の本当の意味は、所有権の移動です。
これは、所有権世界という世界で行われていて、それは目で見えないですけど、頭の中では理解できます。

たとえば、「飴ちゃん、あげる」って言いながら、３次元世界では手で渡す動作をしながら、所有権世界では飴の所有者を自分から相手に書き換えてるわけなんです。
これを、あまりに自然と、無意識にやってるのが人間なんです。

この所有権世界、物に所有権を設定したり、所有権を移動したりします。
この操作はなんでしょう？
これは記号操作です。

現実世界の飴ちゃんを記号に置き換えて操作してるわけです。
記号操作、これはコンピュータが得意な処理です。
だんだん、ＡＩの話に近づいてきましたねぇ。

想像仮想世界は、さっき説明したように、三人称視点で認識するので、自分も客観的に認識できるわけです。
これで、相手、物、自分、全てを客観的に認識できるようになりました。
相手、物、自分を記号に置き換えることができるわけです。

ようやく準備が整いました。
それでは、感謝の心理パターンを考えていきましょう。

友達から飴ちゃんを貰ったとします。
飴ちゃんは、甘くておいしいお菓子なので、価値があります。
「はい、飴ちゃんあげる」って言われて飴ちゃんを手渡されたとします。
「あげる」は所有権の移動なので、飴ちゃんの所有権が相手から自分になるわけです。
飴ちゃんを貰う前と貰った後の変化をみると、価値のある所有物が増えています。

ここで、心理パターンを探索します。
すると、価値のある所有物が増えると、嬉しいという感情が発生する心理パターンが見つかります。
そこで、まず、「嬉しい」という感情が発生します。

さらに心理パターンを探索すると、自分に嬉しい感情が発生した場合で、かつ、その原因が人の場合、その人に対して「感謝」の心理パターンが発生すると見つかります。
これで、感謝の感情が発生します。

「心理パターン」というのは、行動の原動力や欲求となるものです。
たとえば、「お腹がすく」っていう心理パターンの場合、「食べ物を食べる」という欲求を生み出して、食べ物を探したり、「お母さん、お腹がすいたよう」とお母さんを呼びに行ったりします。

「感謝」の心理パターンも同じです。
「感謝」の場合は、「ありがとう」とお礼を言ったり、お返しをするといった行動を生み出します。

ここで、相手に「ありがとう」と言ったとします。
「ありがとう」の言葉を言われた相手は、おそらく「どういたしまして」と答えますよね。
こうして会話が成立するわけです。

もし、これが、何もしてないのに、急に「ありがとう」と言われたとしたら、意味がわからないですよね。
その場合、「えっ、何の事？」ってなりますよね。
これが、言葉の意味を理解して会話してるってことです。

「どういたしまして」の心理パターンは、相手がプラスとなるように行った自分の行為に対して、相手が「ありがとう」と言ったときに返答する言葉として定義できるわけです。
この心理パターンを持っていれば、何もないのに「ありがとう」と言われた場合、「何の事？」って応答できるわけです。

一般的なチャットボットは、「ありがとう」という入力があれば、「どういたしまして」と回答するといった単純なプログラムです。
これじゃぁ、言葉の意味を理解してるとは言えないですよね。

このように、言葉の意味を理解するとは、「心理パターン」への当てはめを行っているわけです。
心理パターンさえ見つかれば、意味の通った返答や行動ができるわけです。

言葉の意味を理解するとは、言い換えれば、どの「心理パターン」に当てはまるかの探索問題を解いてるといえるわけです。

これですべてが繋がりました。
それでは、言葉を交わしたり、人間と同じ社会生活ができるＡＩは、どうやって作るのか。
まとめます。

目で見たり、言葉で聞いた現実世界は、まず、頭の中の想像仮想世界で組み立てられます。
意識は、想像仮想世界を認識します。
想像仮想世界は、３次元世界だけでなく、それ以外の世界に自由に変換できます。
たとえば所有権世界です。

所有権世界は、物に所有権を設置したり、所有権を移動したりします。
ここで一番重要なのは、これは記号処理だということです。

ここで、処理の階層が変わったんです。
現実世界に近い３次元世界から、記号処理の世界に、抽象度のレベルが一段上がったわけです。

そして、心理パターンは、完全に記号処理の世界です。
誰が得したとか、原因は何かとか、論理の世界です。

言語理解で重要なのは、現実の世界から記号世界への変換といえるのです。
ただ、論理的な記号操作ができたからと言って、言葉の意味が理解できるわけじゃありません。
記号操作を終わらせるには、目的、ゴールが必要なんです。

それを分からず、記号操作ができるシステムだけを作って失敗したのが第五世代コンピュータです。
詳しくは、第１８回「第五世代コンピュータはなぜ、失敗したのか」を見てください。

記号操作のゴールはなんでしたか？
それは、心理パターンの探索です。
心理パターンが見つかれば、探索処理はそこで終わります。

そして、心理パターンは、次の行動の原動力となります。
会話なら、返答となるわけです。

感謝の心理パターンだったら「ありがとう」と言ったり、お返しをしたりするわけです。

こうやって、人間らしい行動ができるんです。
人間社会は、こうやってできるわけです。

カエルの場合は、お腹がすいたらエサを探して食べたり、敵を感じて逃げるといったぐらいの行動しかありません。
それは、認識した現実世界が単純だからです。

人間の場合、現実世界を記号化し、目に見えない世界を扱うことで、複雑なことを考えることができるようになりました。

現実世界を記号化し、記号処理を行う。
これができるのは、世界を仮想世界として再構築し、それを意識が認識する仕組みができたからです。
それが意識の仮想世界仮説です。

次回は、この意識の仮想世界仮説をつかって、人工知能の最大の難問に挑みます。
それは、シンボルグラウンディング問題です。

それでは、次回もお楽しみに！