第526回 人の脳はいかにして言葉を話すのか①


ロボマインド・プロジェクト、第526弾!
こんにちは、ロボマインドの田方です。

人間と他の動物の決定的な違いはなんでしょう。
それは、言葉です。
たとえば、チンパンジーに言葉を教えた実験はあります。
手話を教えたら、なん十種類もの言葉を覚えて、「ボールを籠の中に入れて」といった文の意味を理解できるようになりました。
ただ、「昨日、どこどこに行って、こんなことがあったよ」なんてしゃべれるようにはなりませんでした。
いったい、人の脳とチンパンジーの脳では、何が違うんでしょう?

第520回~526回で「目が覚めて、世界を認識する意識プログラム」について解説しました。
そこでは、言葉については触れていませんでしたけど、世界を構成する基本的な要素は全て説明しました。
あとは、それをつなぐだけです。
そして、この「つなぐ」という行為が言語なんです。
これじゃぁ、よく、わからないですか?
それじゃぁ、詳しく説明いたしましょう。
これが、今回のテーマです。

人の脳はいかにして言葉を話すのか①
それでは始めましょう!

これは、前回紹介したマインド・エンジンの全体図です。

プログラムレベルに落とし込むために、今までよりかなり詳しくなりました。
一番詳しくなったのは意識です。
今まで、意識プログラムと呼んでいた部分ですけど、複数のプログラムから構成されるので、今回から、これを意識モジュールと呼ぶことにします。
意識モジュール全体が、広い意味でも意識です。
意識で感じられるもの全てを含んでるという意味です。
だから感情といったデータも含みます。
意識モジュールの中に主体とありますけど、これが狭い意味での意識です。
考えたり、行動を決定する意識の本体です。

今、詳細なプログラムを決めようとしているので、こんな風に、今までと呼び方が変わるところがあります。
じつは、今、もう一つ悩んでいるところがあります。
それは、想像仮想世界です。

想像仮想世界というのは、過去を思い出したり、未来を想像したりとか、目のまえにない世界を想像するときに使う仮想世界です。
そして、これこそが、人間しか持ち得ない最も重要な脳の機能です。
現実仮想世界も含めて、仮想世界とは何かとか、今、詳細を詰めようとしています。

さて、この図で重要なのは意識モジュールの中に注目世界を作ったことです。
まずは、この点について説明します。
何か考えるとき、まず、対象に注目しますよね。
これをコンピュータで考えます。
コンピュータのOSに、GUIとCUIという分け方があります。

GUIというのはグラフィカル・ユーザー・インターフェイスの略で、普段、僕らがつかってるPCのことです。
PCが広く一般に普及したのは、このGUIを搭載したWindows95からです。
最大の特徴はウィンドウとマウスで操作するデスクトップ画面です。

CUIというのは、キャラクター・ユーザー・インターフェイスの略で、真っ黒な画面に文字だけが表示されるそれ以前のOSです。
慣れないとかなり使いにくいです。

GUIの最大の特徴は、マウスでカーソルを操作することです。
カーソルっていうのは、画面の中で、注目してるものを指し示すものですよね。

GUIが使いやすいっていうことは、僕らの意識は、GUIに近いってことです。
つまり、画面全体と、その中の注目する部分って関係で、僕らは世界を認識してるってことです。
もしウィンドウだけでカーソルがなかったとしたら、何に注目していいかわからないでしょ。
だから、意識を作るとき、「注目」って概念は絶対必要なんです。
それが注目世界です。

さて、マウスを発明したのはアラン・ケイです。
アラン・ケイといえば、オブジェクト指向プログラム言語の発明者でもあります。
オブジェクト指向プログラム言語というのは、直感的でわかりやすく作れるプログラムのことです。
アラン・ケイが作ろうとしていたのは、会話するみたいに自然に扱えるコンピュータです。
そのために、人がどのように世界を認識して、どのように考えるかを考えていました。
人と同じように思考するコンピュータができれば、それこそ、人と自然な対話ができるコンピュータになります。
そのために発明したのが、注目するためのマウスと、オブジェクトという概念だったんです。

これはマインド・エンジンでも同じです。
意識モジュールで、今回追加したのが注目世界です。
それから、オブジェクトも重要な概念として最初から取り入れていました。
コンピュータに意識を持たそうとすると、必然的にオブジェクトとか、注目するって機能が必要となるようです。

ただ、脳の中にそのような機能があるのかどうかは、まだ、はわかりません。
ただ、少なくとも、世界で最も使われているOSはGUIで、最も使われているプログラム言語がオブジェクト指向プログラミング言語であることは間違いないです。
このことから、注目するという機能と、オブジェクトという概念は人の思考にかなり近いと言えそうです。

さえ、PCでWordとかExcelとかいくつものアプリを開いているとします。
そして、作業するアプリのウィンドウをクリックして、そのアプリをアクティブ化しますよね。
それと同じで、今、目の前に現実世界に机とか窓とかいろんなものが見えているとします。
たとえば机の上にリンゴがあるとします(机の上にリンゴがある写真)。

意識がみているのは、現実世界をオブジェクトで再現した現実仮想世界です。
図をみてわかるように、現実仮想世界は意識の外に作られています。

今まで、仮想世界は3DCGで作られると言ってきました。
ここを、今回から修正しようと思います。

プロジェクト・エデンでは、現実世界はメタバースです。
マインド・エンジンは、今見えてる世界を、カメラで二次元画像として撮影します。
これは、脳の一次視覚野に映し出された映像とと同じです。

修正っていうのは、現実仮想世界を3DCGでなく、二次元画像にします。
ただし、物体認識までは行います。
マインド・エンジンでは、YOLOという物体認識システムを搭載しています。
YOLOは、写真を渡すと、こんな風に写っている物体を検出します。

これは、デスクトップに、WordとExcelのウィンドウが開いているのと同じです。
ぼぉーっと目の前の空間をみて、机の上にリンゴがあるなぁってわかる程度です。
これが現実仮想世界で、その時点では、まだ、二次元画像っていうわけです。

今、リンゴを指さしたとします。(リンゴ本体を指さしている写真)
C:\Users\takata\AppData\Local\Microsoft\Windows\INetCache\Content.Word\photo01.jpgC:\Users\takata\AppData\Local\Microsoft\Windows\INetCache\Content.Word\finger-pointing-pointer-sign-gesture-260nw-2478213007.jpg

この指がカーソルに当たります。
PCだと、ExcelのウィンドウをクリックしてExcelをアクティブにした状態です。
Excelがアクティブになったらセルに数値を入力したり、合計を計算したりできるようになります。
これは、Excelのプログラムがメモリーにロードされて実際に使えるようになったわけです。
それまでは、Excelの見た目の部分だけデスクトップに表示してただけです。
その状態で出来るのは、ウィンドウをつまんで位置を動かすぐらいです。
この制御をしてるのはOSです。
マインド・エンジンは、心のOSです。
マインド・エンジンの現実仮想世界は、デスクトップです。
机やリンゴの画像を表示してるだけの状態です。

リンゴの画像を指さすことで、リンゴがアクティブになります。
この瞬間、指さしたオブジェクトを操作できるようになります。
ここを詳しく見ていきます。

リンゴを指さすとは、リンゴに注目するということです。
リンゴに注目するというのは、意識モジュールの注目世界にリンゴオブジェクトが生成されたことです。
注目世界には3D世界があって、3Dオブジェクトを扱います。
つまり、二次元画像のリンゴから3Dのリンゴオブジェクトが生成されたわけです。

マインド・エンジンは3Dデータをデータベースにもっていて、その中にリンゴの3Dオブジェクトもあります。
物体認識した時点でリンゴということはわかっていますので、リンゴで3Dデータベースを検索して、3Dオブジェクトのリンゴを3D世界に生成します。
この瞬間、二次元のリンゴが三次元のリンゴになるわけです。
今までぼぉーっとみえていただけですけど、それが、立体になった浮かび上がって見えたわけです。

たとえば、これをぼぉーっと見てるときは、黒い線で何か描かれてるなぁって思うだけです。
これを、何が描かれてるのかなぁって注目したら、「あっ、立方体かぁ」って思います。
「立方体」と感じた瞬間、二次元の画像から3Dオブジェクトが生成されたわけです。
これが注目世界の3D世界に入ったってことです。

じゃぁ、3D世界に入ったってことは、どういうことでしょう?
それは、その3Dオブジェクトにアクセスできるってことです。

たとえば、3Dオブジェクトなので形が球体だってことがわかります。
丸くて、見えない裏側も丸くなってるだろうなぁって感じることです。
それから、「ここは何色ですか?」って聞かれたら(本体を指さす)




「赤です」って答えます。
「じゃぁ、ここは何色ですか?」って聞かれたら(葉っぱを指さす)
「緑です」って答えます。
これができるのは、位置や色って概念を理解してるからです。
逆に言うと、3D世界には位置や色を持っているわけです。
だから、指さした色を答えられるんです。

じゃぁ、答えてるのは誰でしょう?
それは、意識モジュールの中の主体です。
主体は、注目世界のオブジェクトにアクセスして、いろいろ操作できます。
次は、このことについて説明します。

まず、3D世界というのはあくまでも見た目の世界です。
現実世界の見た目を忠実に再現したものが3D世界で、脳でいえば、これは右脳です。
ここで注意しないといけないのは、現実世界は自分の意志で変更できません。
たとえば、リンゴが宙に浮かんでるところを想像することはできますけど、想像したからといって、現実世界でリンゴが宙に浮きあがることはありません。
それができたら超能力です。

ところが、唯一、思うだけで現実を変化させることができるものがあります。
何かわかりますか?

それは、自分の体です。
右手を上げたいと思って、右手を上げることができますよね。
まぁ、当たり前のことを言ってるだけですけど、そう思うのは、人間だからです。

コンピュータで実現させるには、この当たり前の部分を作らないといけません。
つまり、思っても変わらない部分と、思って変えることができる部分があるということは、それぞれ別にデータ管理しないといけないってことです。
このデータ管理のまとまりのことを、僕は世界と呼んでいます。
それじゃぁ、世界を少しずつ定義していきます。

まずあるのが3D世界ですよね。
3D世界は、三次元空間と、その中に配置される3Dオブジェクトで構成されます。
今の場合あら、机とかリンゴが3Dオブジェクトです。
そして、三次元空間の中に、自分の体もあるわけです。
自分の体も3Dオブジェクトです。
ただ、他のオブジェクトと違うのは自分の体は、自分の意志で動かせるということです。

そこで、これを身体世界として区別します。
注意してほしいのは、身体世界は3D世界と別にあるんじゃなくて、一部は3D世界に含まれるということです。
その一部というのが、見た目の身体の部分です。
じゃぁ、なんで分ける必要があるのでしょうか?

それは、データ量の問題です。
たとえば、ChatGPTIは質問したらなんでも答えてくれますよね。
それができるのは、何億冊の本とか、とんでもない量のデータを暗記してるからです。
そんなこと人間はしていません。

逆に、AIは何億冊の本を暗記できても、本に書いてある内容や意味を理解できません。
でも、人間は意味を理解します。
意味理解の第一歩が、今、何の話をしてるのかってわかることです。
それが世界です。

世界の分け方として、僕は、その世界固有の情報で分けようと考えました。
たとえば3D世界は見た目の世界なので、位置とか色といった情報を持っています。
それから、位置を指定したら、その位置にある3Dオブジェクトを取得したり、色を取得するメソッドもあります。
こういったメソッドが3D世界に定義されているわけです。
だから、「これは何?」とか「これは何色?」って指さしたら、「リンゴ」とか「赤」って答えることができます。
答えるのは主体で、主体は3D世界のメソッドを使って答えます。

それと同じで、身体世界というものも作ります。
身体世界は、3D世界の3Dオブジェクトと違って、主体の意志で動かすことができます。
その時使うのが、手を上げるメソッドとか、ものをつかむメソッドです。
これらのメソッドが予め身体世界に用意されています。
それから、身体世界は身体オブジェクトを3D世界にもちます。
だから、自分の体の位置は3D世界の位置情報で扱えます。

たとえば、「リンゴをつかんで」といわれたとします。
すると、まず、注目世界の3D世界にリンゴオブジェクトを生成します。
すると、主体はリンゴオブジェクトから位置を把握できます。

次に、注目世界に身体世界をロードします。
主体は、身体世界の「つかむメソッド」にリンゴオブジェクトをパラメータとしてわたします。
すると、リンゴオブジェクトの位置情報を使って、手を伸ばしてリンゴをつかみます。
これが、「リンゴをつかむ」です。

注意してほしいのは、主体が扱うのはリンゴオブジェクトと「つかむメソッド」だけだってことです。
リンゴをつかむには、腕を伸ばしたり、指を曲げなければいけません。
そのためには腕や指の筋肉の一つ一つを制御しないといけません。
でも、主体はそこまでは感知しません。
ただ、メソッドにパラメータを渡すだけです。
これが「リンゴをつかむ」の意味を理解したということです。
言い換えると、言葉の意味を理解するとは、世界と、その世界のメソッドを適切に選択できると言えます。

ただ、このぐらいの言葉はチンパンジーでも理解できます。
人間しか理解できない言葉は、さらに複雑ですけど、ここで時間が来てしまいました。
続きは、次回とします。


はい、今回の動画が面白かったらチャンネル登録、高評価お願いしますね。
それから、意識の仮想世界仮説に興味があるかたは、こちらの本も読んでください。
それじゃぁ、次回も、おっ楽しみに!