第232回　心の仕組みを解明する意外なツール

ロボマインド・プロジェクト、第232弾！
こんにちは、ロボマインドの田方です。

このチャンネルを初めて、約２年が経ちます。
このチャンネルの一番の目的は、自分の頭を整理することなんです。
僕は、コンピュータで心を作ろうとしてます。
でも、コンピュータでどうやって心を作るかなんか、本には書いてないです。
ただ、最初に、ざっくりしたアイデアだけがありました。
そのアイデアを、コンピュータで実装できるレベルまで落とし込む作業が必要だったんです。
そこで、無理やり頭から絞り出すために、週に2～3本、YouTubeを上げることにしたわけです。

最初にあった、ざっくりしたアイデアってのは、人が、どうやって世界を認識してるかってことです。
人は、目で見た現実世界を、頭の中に仮想世界として構築します。
意識は、この仮想世界を介して現実世界を認識します。
このことは、この本に詳しくかいてるので、良かったら読んでください。

ここまでは分かったんですけど、仮想世界の詳細な構造がわからなかったんですよ。
どうやったら、細かい構造を解明できるか、その方法が分からなかったんですよ。
それがね、ある物を使えば、簡単に分かるってことに気付いたんですよ。
それは、普段、何気なく使ってるものです。
これが、今回のテーマです。
心の仕組みを解明する意外なツール
それでは、始めましょう！

まずは、心の基本構造です。
心は、二つのレイヤーで考える必要があります。
まず、第一レイヤーです。
それは、感覚器を通して、何かを認識するレイヤーです。
ここは、脳でもかなり明らかになっています。

目から最初に送られるのは、後頭部の一次視覚野Ｖ１です。
V1では、単純な直線を認識し、V2、V3と処理が進むにしたがって、だんだん、複雑な図形を認識して、ITになると、手や顔を認識するようになります。

さて、次の第二レイヤーは、第一レイヤーで認識したものを使って仮想世界を作ります。
3次元世界なら、3次元空間を作って、そこに認識したものを配置します。

仮想世界は、3次元世界だけでなくて、所有権世界とかもあります。
所有権世界っていうのは、誰が何を持ってるかとか、売り買いとかを理解するときに使う世界です。
所有権世界に、人や物を配置して、誰が何を持ってるって関係を管理します。
そして、意識が認識するのは、この第二レイヤーです。

第一レイヤーで、例えばリンゴと認識されたら、第二レイヤーでは、リンゴのオブジェクトが仮想世界に生成されます。
第二レイヤーのオブジェクトは、記憶から生成されます。
だから、実際には見えなくても、中には実が詰まってるとか、どんな味や香りがするとかまでわかります。
リンゴが売ってて、買おうかどうしようか考えてるってときには、所有権世界を使います。

この、第二レイヤーのリンゴオブジェクトは、第一レイヤーのリンゴを変換した別物です。
ここ、何がどう変わったのか、丁寧に説明しますね。

たとえば、手描きの数式を認識して計算するシステムを考えてみます。
鉛筆で「１＋２」って紙に書いたとします。
それをカメラで認識して、「３」って答えるシステムです。

数字を認識するレイヤーは、画像のパターン認識を使います。
縦棒だったら１とかって認識します。
それを、数字の１に変換して計算レイヤーに渡します。
計算レイヤーでは、計算して答えを出すわけです。

縦棒って画像のままじゃ、計算できないですけど、それを数字に変換したから計算できたわけですよね。
縦棒って画像の世界と、計算の世界じゃ、全然別の世界ですよね。
世界が違うってのは、こういう事です。

これと同じです。
画像としての第一レイヤーのリンゴと、仮想世界のオブジェクトとなった第二レイヤーのリンゴじゃ、完全に別物なんです。
別の次元、別の世界のものに変換されたんです。
つまり、第一レイヤーと第二レイヤーとは、連続してないんです。
ここが重要なんですよ。

さて、第二レイヤーのオブジェクト、これ、脳科学で別の言い方をすると何かわかりますか？
それは、「クオリア」です。

クオリアっていうのは、意識や主観が認識するものです。
物理世界にある赤は、波長約700nmの光です。
この赤を、意識の側から感じるとき、それを赤のクオリアって言います。

意識のハードプロブレムってのがあります。
意識のハードプロブレムっていうのは、脳内の処理をいくら解析しても、意識が感じるクオリアには、絶対に辿り着かないってことです。

これを、第一レイヤーと第二レイヤーで考えてみます。
第一レイヤーは、目の網膜からの信号を、脳内で処理するって話ですよね。
これは、脳内の処理を追っていけばわかります。
でも、第二レイヤーのリンゴオブジェクトは、脳のどこにあるのか分かりません。
これが、リンゴのクオリアです。

これだけ脳科学は進歩してるのに、なぜ、クオリアが見つからないのか？
もう、分かりますよね。
それは、クオリアは、第二レイヤーにあるからです。
第一レイヤーは物理世界にあります。
でも、第二レイヤーは、全く別の世界です。
別の世界に飛ばされたわけです。

よく、小説とかアニメで、異世界転生ものってありますよね。
主人公が異世界に転生したら、勇者になってたり、魔法使いになってたりって話です。
第一レイヤーから第二レイヤーへ行くのって、あんな感じです。

言いたいのは、第一レイヤーも、第二レイヤーも、それぞれ、独立した世界だってことです。
世界ってのは、ルールや法則があって、その世界に存在するものは、全て、その世界の法則に従うってことです。
そして、それぞれの世界は、独立してます。
お互いに干渉しません。

だから、意識が感じる第二レイヤーのクオリアがどうなってるかなんか、物理世界の第一レイヤーをいくら分析しても分からないんですよ。
冴えない高校生が、異世界で勇者となって活躍してるなんて、こっちの世界からは想像もできないわけです。
まぁ、異世界転生は漫画の話ですけど、第二レイヤーの仮想世界は、コンピュータで作ろうと思えば作れますよね。
コンピュータ・プログラムで作った仮想世界を認識するプログラムも作れますよね。
仮想世界を認識したり、操作して、行動を決定するプログラムです。
それが、意識プログラムです。
つまり、主観とか意識って、脳を研究するより、プログラムで作った方が早いんですよ。

今言った話は、そっくりそのまま、AIにも当てはまります。
ディープラーニングによって、高精度な顔認識ができるようになりました。
ディープラーニングの中の処理を見てみると、単純な線から始まって、徐々に複雑な形状を認識しています。

これなんか、脳の視覚の処理と同じですよね。
ということは、これは、第一レイヤーってことです。
これを、いくら続けても第二レイヤーには辿り着かないんです。
つまり、意識や主観はディープラーニングからは生まれないんです。
ここが、ディープラーニングの限界です。

さて、長くなりましたけど、本題は、こっからです。
第二レイヤーの主役は、仮想世界です。
意識は、仮想世界に配置されるオブジェクトを認識します。
最初にも話しましたけど、分からないのは、仮想世界の詳細な構造です。
オブジェクトが配置される以上の、仮想世界の詳細な構造が分からなかったんです。

そこで、僕が注目したのが言語です。
もっと言えば、文法です。
仮想世界には、リンゴとか人のオブジェクトが配置されますよね。
オブジェクトってのは、オブジェクト指向プログラミングのオブジェクトと同じです。
オブジェクトは、属性を表すプロパティと、動きを表すメソッドを持っています。
人なら「太郎」とかって名前プロパティを持ってますし、「歩く」とか「食べる」ってメソッドをもってるわけです。
このオブジェクトとかプロパティは、言語で言えば名詞です。
メソッドは、動詞です。
そして、仮想世界の状況を文字で表現したのが文になります。
つまり、仮想世界の構造は、文にすべて表現されてるはずですよね。
ということは、文を解析すれば、仮想世界の詳細な構造も分かるんじゃないかって考えたんですよ。

たとえば、仮想世界に配置したリンゴオブジェクトを文で表現するとすれば、「りんごがある」ってなりますよね。
仮想世界の太郎オブジェクトが、リンゴオブジェクトを食べてるところは、「太郎がリンゴをたべる」って文になりますよね。
逆に言えば、この単純な仮想世界で表現できるのは、こんな文だけってことです。
でも、文には、もっと表現できることがいっぱいありますよね。
たとえば、過去とか未来のこととか。
つまり、過去や未来を表現するには、それに対応する仮想世界の構造が必要ってことです。
たとえば、その出来事が起こってるのが、過去か未来かを示す目印とかを、仮想世界に付けるわけです。
過去の目印が付いてたら、文にするとき、動詞を過去形にします。
未来の目印が付いてたら、文にするとき、動詞に「だろう」って助動詞を付けるんです。
文法を見れば、仮想世界に必要な構造がわかるって、こういう事です。

仮想世界のオブジェクトは、単語に当たります。
語彙です。
語彙は増やせばいいって、分かりやすいんですけど、文法って、分かりにくいんですよ。
でも、文法は、世界そのものの構造を決める大事なものなんです。
構造とか、基本的なものほど、当たり前すぎて、見過ごしてしまうんですよ。
それじゃぁ、もうちょっと考えてみますよ。

たとえば、「太郎が、家から学校へ行く」って文を考えます。
「から」とか「へ」って助詞ですよね。
助詞って、何のためにあるんでしょう？

まず、この状況を仮想世界で再現してみます。
すると、太郎君が、家から学校へ行く状況を再現できますよね。
この時、出発地が家で、目的地が学校ですよね。
どうも、「行く」って動詞には、出発地と目的地が必要なようです。
動詞は、オブジェクトが持つメソッドです。

これをプログラムで考えてみます。
メソッドっていうのは、プログラムでいえば関数です。
関数って言うのは、パラメータを渡して実行します。
たとえば、足し算関数add（）ってのを考えます。
この足し算関数に二つの値、２と３を渡す場合、add(2,3)となります。
そして、これを実行すると、二つの数を足した合計の５を返します。
このとき渡した２と３がパラメータです。

「行く」も同じと考えます。
「行く」ってメソッドを実行するには、出発地と目的地ってパラメータが必要なわけです。
そこで、家と学校をパラメータとして渡すわけです。
ただ、どっちが出発地で、どっちが目的地が分かるように渡さないといけません。
それを文で示すとき、「から」と「へ」っていう助詞で示すわけです。
「から」が付いてる方が出発地で、「へ」が付いてる方が目的地です。
だから、「家から学校へ行く」って文になるわけです。
つまり、動詞メソッドに渡すパラメータの種類を区別すること。
これが助詞の役割と言えそうです。

こうやって考えたら、頭の中の仮想世界と、それを表現した文って、きっちり対応関係にあるってわかりますよね。
助詞とか助動詞とか、普段、あまり気にすることないですけど、こうやって分析していけば、仮想世界の構造が明確になって来るんですよ。

心の構造って、こうやれば解明できるんです。
ＣＴとかＭＲＩで脳を観察したり、電極挿したりしても、意識や主観は見えてきません。
それより、じつは、助詞とか助動詞を調べた方が、主観の中身がわかるんですよ。
これが、ロボマインドのやり方ってわけです。

はい、今回の動画が面白かったらチャンネル登録、高評価お願いしますね。
それじゃぁ、次回も、おっ楽しみに！