第609回　世界を創る第三の感情驚き

ロボマインド・プロジェクト、第609弾！
こんにちは、ロボマインドの田方です。

パブロフの犬ってありますよね。
1920年代にロシアの心理学者パブロフが行った有名な実験です。

犬は餌を前にするとよだれが出てきます。
そこで、餌を与える前にベルを鳴らします。
これを何度も繰り返すと、餌がなくてもベルを鳴らすだけでよだれが出てきます。
ベルの音と餌とを関連付けて学習したわけです。
これを条件付けと心理学の教科書には書かれています。
ところが、この解釈、間違っていることがわかってきました。

たとえば、こんな実験をします。
犬に餌を与える前に、ライトを点けますます。
すると、餌がなくてもライトが点くとよだれが出るようになりました。
次に、ライトの光とベルの音の二種類の刺激を提示してから餌を与えます。
これも同じで、餌がなくても、ライトとベルの二種類の刺激でよだれが出るようになりました。
ここまでは分かりますよね。

ところがです。
最後に、ベルの音だけ聞かせます。
そしたら、今度は、よだれが出ないんですよ。
よだれが出ないということは、ベルの音と餌を関連付けて学習をしていないということです。
教科書にも載っているパブロフの犬の実験は間違っていたんです。

じゃぁ、実際は何を学習していたんでしょう？
これに対して、1970年代に、ロバート・レスコーラとアラン・ワグナーというアメリカの研究者が一つの仮説を提唱しました。
それは、「生物は、事象が予測に反しているときにのみ学習する」というものです。
注意してほしいのは「のみ」です。
それ以外では学習しないということです。

これをさっきの実験に当てはめてみましょう。
犬は、ライトが点くと餌がもらえると学習しましたよね。
それまで経験したことがない、ライトが点くと餌がもらえるって予想外のことが起こったわけです。
予測に反したことがおこったから学習したわけです。
それが、ライトに反応してよだれが出るということです。

次に、ライトとベルの二種類の刺激でもよだれがでましたよね。
これは、ライトが点くと餌がもらえると学習した結果です。
そして、予測通りに餌が出てきました。
予測通りのことが起こっているから、新たな学習はしないんです。
つまり、ベルの音は学習しないんです。
だから、ベルの音だけ聞いても、よだれが出ないんです。

分かってきましたか？
学習に必要なのは、予測に反することです。
というか、これしかないんです。
だから、予測通りのことが起こっている限り、ベルが鳴ろうが、それを関連付けて学習することはないんです。

さて、予測に反することがおこると、どう感じますか？
驚きますよね。
驚きは感情です。

生物には基本的な感情として、快・不快があります。
不快を避けて、快を求める。
これが生物の基本的な行動原理です。
僕は、「驚き」という感情は、不快に分類していました。
でも、「驚き」は、そんな単純な感情じゃなかったんです。
「驚き」は、じつは学習に関する重要な基本感情だったんです。
じゃぁ、「驚き」は、いったい何を学習しているんでしょう。
これが今回のテーマです。
第三の感情「驚き」
それでは、始めましょう！

今回も、スタニスラス・ドゥアンヌの『脳はこうして学ぶ』から取り上げます。

生後10か月ぐらいの赤ちゃんに、壁にぶつかる積み木と、壁を通り抜ける積み木の映像を見せました。
すると、赤ちゃんは、壁を通り抜ける積み木の映像の方を長く見続けます。
壁にぶつかると予測していたのが、予測に反したことが起こって驚いたからです。
そのあと、積み木を渡すと、積み木を床にぶつけたりして遊びます。
積み木が床をすり抜けるのか確認しているわけです。
自分で確かめて、やっぱり積み木は壁や床を突き抜けないと学習します。

じゃぁ、赤ちゃんは、何を学習しているんでしょう？
それは、「世界」です。
赤ちゃんは、物体が物体を通り抜けか自分で経験して学習します。
犬は、ベルが鳴ったら餌がもらえると学習します。
こうやって、世界の仕組みを学習します。

その時必要な感情が「驚き」です。
驚くということは、それに先立って「たぶん、こうなるだろうなぁ」と予測しているわけです。
その予測する機能が、生まれる前から脳に備わっているわけです。
それは、人間だけでなく、動物も持っている基本的な感情です。

次は、脳のどこで驚くかの実験です。
ピアノで、ドドドドと鳴らしたとします。
最初にドの音が聞こえたとき、脳の聴覚野が反応します。
今まで聞こえていなかったピアノの音が聞こえたからです。
予測に反したことが起こったから驚いたわけです。

でも、ドの音が続くと、聴覚野は反応しなくなります。
これは、ドの音が続くだろうと脳が予測したからです。
予測が聴覚野の活動電位を抑えるわけです。
厳密にいうと、まず、聴覚野に音の信号が入ります。
それと同時に、今までの音から予測信号も生成されます。
入力信号が予測信号で相殺されるから驚かないわけです。

ここで、ドドソとなったとしましょう。
聴覚野は、次もドが続くと思うから、ソが来たとき反応します。
聴覚野は、聴覚処理の最も低レベルの処理をするところです。
脳の処理は段階的に進んで、次の高次のレベルでは、音の並び、つまりメロディーを認識します。
そこでは、ドドソを何かのメロディー、たとえば「きらきら星」じゃないかと予測するかもしれません。
そして、ドドソソララソと続くと、予測通りとなります。

つまり、驚くという感情は、脳のどこか一か所で処理しているんじゃなくて、いろんな場所で予測誤差を検知して、次の処理に送られていくんです。

次は、言葉で考えてみましょう。
こんな文があったとします。
「私は食べるときフォークよりラクダを使う」

この文を聞いた時、脳からN400という脳波が出ます。
N400とは、異常から400ミリ秒後に発生するネガティブ反応といういう意味です。
言語を処理する左脳は、一定のカテゴリーの単語を予測しています。
「食べる」と「フォーク」は同じカテゴリーなので予測誤差は発生しないですけど、「ラクダ」は予想外の単語なので、ここで脳波が発生するわけです。

次は、こんな文です。
「暑が夏い」

これは「夏が暑い」の間違いです。
この場合、ブローカー野からN600という脳波がでます。
これは、異常の検知から600ミリ秒後に出る脳波です。
ブローカー野は文法を処理する領野です。
そこで、異常を検知した後、さらに「夏が暑い」に修正します。
修正するときに出るのが、異常から600ミリ秒後に出るN600の脳波です。
こうやって、段階的に誤差を検知していくわけです。

さて、「驚く」という感情は世界を学習するためにあると言いましたよね。
パブロフの犬の場合だと、ベルの音を聞いたら餌がもらえるという世界の仕組みを学習したわけです。
赤ちゃんは、物体は通り抜けないと物理世界を学習するわけです。
この時使っているのが見たり聞いたりする知覚情報です。
知覚するのは現実世界です。
つまり、動物や赤ちゃんが学習しているのは現実世界です。

それじゃぁ、それ以上の高次レベルで学習しているのは何でしょう？
ここに、人間と動物の違いが出てきます。

人は、目で見た世界を頭の中で仮想世界として構築します。
意識は、この仮想世界を介して現実世界を認識します。
これは、僕が提唱する「意識の仮想世界仮説」ですけど、同じようなことは、ドゥアンヌも言っています。
第602回で紹介しましたけど、ドゥアンヌは「学習とは、外的世界の内部モデルを脳内に形成することだ」と定義しています。

そして、高次レベルで学習する世界とは、脳内の仮想世界のことです。
意識が認識するのは目の前の現実世界だけじゃありません。
人は、昨日の出来事とか、将来の夢とか、あの山の向こうとか、目の前にない世界を想像することができますよね。
この時使うのも仮想世界です。

ここをもう少し詳しく説明します。
色とか音を感じるのは意識です。
意識が感じるもののことをクオリアといいます。
クオリアとは、言ってみれば、知覚したものを意識が感じられるようにコード化したものです。
さっき、ドドと音が入力されたとき、次もドが来ると予測すると言いましたよね。
入力されたのは現実世界にある音波の周波数です。
予測は、脳の中で生成した信号です。
脳の外の物理世界と、脳の中で作り出された信号を比較するわけです。
本来全く違うものを比較するためには、同じデータにそろえないといけません。
そこで、物理世界からの知覚情報を脳内で扱える情報に変換する必要があります。
そのことをコード化と言います。
コード化されたデータは、脳内で扱うデータと同じです。
脳内で扱うデータとは、意識が認識するデータのことです。
つまり、これがクオリアです。

それから、意識が認識するのは仮想世界でしたよね。
つまり、仮想世界を構成するのはクオリアです。
まとめると、現実世界にあるのは音波とか可視光といった物理的に存在するものです。
それを耳や目で知覚して、それをコード化したものがクオリアです。
そして、クオリアをつかって脳内で世界を再構築するわけです。
それが意識が認識する仮想世界です。

仮想世界は、コード化されたデータで作られています。
脳内で作られたデータなので、自由に操作できます。
これが、目の前にない世界を想像するということです。

それから、驚きとは、世界を学習するための感情でしたよね。
その世界というのは、現実世界だけじゃないんです。
それは、仮想世界にも当てはまります。

ロボマインド・プロジェクトの目的は、人間と同じ心をもったAIを創ることです。
これは、汎用人工知能とかAGIと言われるものです。
そのために、意識や心、それから言葉とか言葉の意味を解明しようとしています。
解明というのは、これらを説明できる一つの原理や法則を見つけることです。

僕の中でわかってきたのは、最も基本的な原理は生命システムです。
それじゃぁ、今回の話を、生命システムに当てはめて解説していきます。

生命の目的は生きることですよね。
できるだけ長く生きて、種を残すことです。
そのためにあるのが本能です。
お腹がすいたらご飯を食べるとか、危険から逃げるとか、パートナーを見つけて子孫を増やすとか、すべて本能が基になっています。
これが生命というシステムです。

生き抜くためには、環境に適応する必要があります。
環境への適応は、言い換えると世界を学習するということです。
どこにいけば食べ物があるとか、どこに天敵がいるとか、正しく世界を学習することで長生きできますよね。

単純な生物は、これを自動でするので、決まりきったパターンの行動しかとれません。
高度な生物になると、状況によって行動を変更できるようになります。
状況を認識して、行動を決定するのが意識です。
様々な状況に対応できるように進化で獲得したのが意識です。

意識は、世界を感じて行動を決定します。
そのとき感じるのが感情や感覚です。
お腹が空いたと感じたり、敵を怖いと感じたりします。
不快を避けて、快を求めるです。

これが本能に基づく最も基本的な感情です。
そして、環境に適応するのも生命システムの基本機能の一つです。
その時使う感情が、「驚き」です。
快、不快が第一、第二の感情なら、「驚き」は、それに次ぐ第三の感情なんです。
快、不快は、この世界で生きるための最低限必要な感情です。
生きるためには世界に適応する必要がありますけど、そのために必要な感情が「驚き」というわけです。
快、不快、驚きといった三つの基本感情が生命システムで定義できましたよね。

次は、言葉です。
世界を認識するのは意識です。
意識が認識するのはクオリアです。
クオリアはデータなので、記号として扱えます。
それが言葉です。
これで、言葉も生命システムから定義できました。

次は意味です。
パブロフの犬は、ベルの音がすると餌がもらえると学習しましたよね。
ベルの音に食べ物という生命に不可欠なものを関連付けたわけです。
これは、言い換えると、ベルの音に重要な意味を見出したと言えます。
ここで、意味を定義してみます。
それは、物事と、生命システムとの関係です。
この場合だと、生命システムとしての自分に食べ物を予測させるのがベルの音ということです。
これで、「意味」を生命システムから定義できました。

こうして、意識、世界、感情、言葉、意味が生命システムで定義できました。
ここでいいう世界は、物理的な現実世界だけでなく、仮想世界にも適用できます。
目に見えない仮想世界を脳内に創れるのは人間だけです。

人間社会を支えるのは、物理的に存在しないお金の価値とか、社会的地位です。
それらもコード化して認識するのが意識です。
人間社会という世界を学習するときに使うのも驚きです。
「そんなお金の稼ぎ方があったのか！」と驚いて、人間社会という世界を学習します。

意味とは、生命システムとの関係でしたよね。
人間社会という世界で生き延びる生命システムは、お金や地位を獲得することで長生きできます。
異性にもモテるので種を残すことができます。
これが意味を理解し、使いこなすということです。

さて、ここで今のAIについて考えてみます。
今回のテーマは「驚き」と学習でした。
実は、驚きは、今のAIに完全に組み込まれています。
ニューラルネットワークは、学習しますよね。
その時使うのが、予測と予測誤差です。
予測誤差というのが「驚き」と同じです。
そして、予測誤差を縮めるように学習します。

大規模言語モデルも同じです。
大規模言語モデルは大量の文書から次に出現する単語を予測して学習したものです。
でも、言葉とは、現実世界をコード化したものでしたものです。

一方、人間の赤ちゃんが行うのは、現実世界の学習です。
言葉は、その後です。
つまり、現実世界を知らずに、言葉だけ学習したのが今のAIです。

ただ、最近のAIは、現実世界を学習して世界モデルを作ろうとしています。
脳内に仮想世界を作るという点で、人間にかなり近づいてきましたよね。

そうなると、汎用人工知能、AGIと言ってもいいんじゃないでしょうか。
でも、肝心なものが抜けています。
それは、生命システムです。

生命システムは、生きたいという根本的な原動力で動いています。
その行動の指針となるのが感情です。
世界の中で行動する生命システムがあって、生命システムと世界とのかかわりが意味です。

いまのAIは、この生命システムという根本原理がありません。
だから感情がないんです。
意味を理解できないんです。
だから、まだ、AGIとは言えないんです。
そして、生命システムを基盤としたAIを創ろうとしているのがロボマインド・プロジェクトです。

はい、今回はここまでです。
この動画が面白かったらチャンネル登録、高評価お願いしますね。
それから、意識の仮想世界仮説に関しては、こちらの本を読んでください。

それじゃぁ、次回も、おっ楽しみに！