ロボマインド・プロジェクト、第224弾!
こんにちは、ロボマインドの田方です。
マインド・エンジンが、バージョンアップしました。
今回のバージョンを見れば、マインド・エンジンが進む方向が、だいぶ、見えてくると思うんですよ。
マインド・エンジンが目指すのは、人と普通に会話ができるシステムです。
だから、言語学とか、AIなら、自然言語処理とかが一番近いんです。
僕も、最初はそんなのをよく調べてました。
でもねぇ、なんか、目指してるのが違う気がするんですよ。
たとえば、言語学なら文法とかありますよね。
でも、文法って、どちらかと言うと、言葉の表面的なことじゃないですか。
重要なのは、何が言いたいかの中身の方じゃないですか。
でも、言語学って、中身についてはあんまり研究してないんですよ。
AIにしても同じです。
大量の文書を学習させて、自然な文章を生成したりとかしてます。
それで、できた文章を読むと、たしかに、文法的な間違がなくて、自然に読めます。
でも、何が言いたいのか意味がよく分からない文章になってたりします。
この辺りのことは、第174回「GPT-3 検証した あご外れた」とか見てもらったら分かると思います。
僕が作りたいのは、その逆なんですよ。
多少、文法が間違っても、何が言いたいかわかる文章を生成するAIです。
頭の中で考えてる中身を文字で表現したのが言葉です。
文字で表現するとき、単語をどう並べるかとか、動詞をどう変形させるとかが必要になってきます。
でも、それは最後の話です。
そんな最後の細かい話より、その前の段階。
頭の中で考えてる中身の方に、僕は興味があるんです。
もちろん、最後の段階に興味があって研究するのはその人の自由なんで、それについては、僕がどうこういう話じゃないです。
分からないのは、中身の方、人は頭の中で、どのように考えるかって研究をしてる人がほとんどいないってことなんですよ。
頭の中で考えてることって、一言で言えば、意識や主観はどのように情報を処理してるかってことです。
たぶん、そこも重要やって思った人は、いっぱいいると思います。
ただ、意識や主観て、あまりにも漠然としてて、どうやって作ったらいいのか、見当もつかないんで、研究にまでならないんやと思うんですよ。
意識は量子効果で生まれるので、量子コンピュータでないとできないとかって言ってる人もいますしね。
そこで、今回のマインド・エンジンのデモです。
これを見れば、「あぁ、たしかに、頭のなかでは、そんな風に処理してるわ」って実感できると思います。
主観が、具体的に何をやってるのか、納得できると思います。
これが今回のテーマです。
主観の仕組み、全部見せます。
それでは、始めましょう!
マインド・エンジンのデモ、この前は、一行目の「コンビニがある」の解説が終わるまでに、4回かかってました。
そんなことしてたら、誰も見てくれなくなるので、今回は、最初に、一気に全部見せます。
全体を見てもらってから、細かい解説しようと思います。
その前に、今回のバージョンアップの見どころを説明しときます。
前回のデモを見せた時、まず、言われたのが、「仮想世界って3Dじゃないの?」ってことでした。
皆さん、3DCGを期待してましたよね。
たしかに、僕も、頭の中に3次元の仮想世界を作りますって、いっつも説明してましたし。
ただ、仮想世界は3次元だけじゃないとも、いってます。
物の所有権関係を表す所有権世界とか、人間関係を表す人間関係世界とか、そりゃ、もう、ありとあらゆる仮想世界が考えられるんです。
前回のデモの最大の目的は、マインド・エンジンのプラットフォームを作るってことでした。
全体の枠組みを示すことです。
なので、仮想世界は、ちょっと横着して、作りやすい所有権世界にしたわけです。
そこを、今回は3次元の仮想世界を、ちゃんと作りましたよ。
ベースは、以前と同じ、ゲームエンジンのunityを使ってます。
ただ、今回の見どころってのは、三次元の仮想世界ってとこじゃないんです。
そこじゃなくて、複数の仮想世界を扱えるってとこなんです。
ここ、めっちゃ重要なんです。
さっき言いましたけど、主観がどんな処理をしてるのかって、みんな、漠然としてわからないんですよ。
何でわからないかって言うと、あまりにも自然に処理してるからです。
意識せずに自然にやってるもんやから、何をやってるのか説明できないんですよ。
その処理の一つが、仮想世界の切り替えなんですよ。
たとえば、リンゴがあるとするでしょ。
リンゴを手で持ったり、落としたりするとするでしょ。
これって、3次元世界の物体として扱ってるわけです。
だから、この時のリンゴは三次元世界のリンゴなんです。
一方、リンゴは売ったり、買ったりすることもできます。
リンゴを買うと、リンゴの所有権がお店から自分に移ります。
この時のリンゴは、所有権世界のリンゴです。
同じリンゴでも、違う世界の話って分かりますよね。
じゃぁ、世界が切り替わるって、具体的に、何が変わってるんでしょう?
三次元世界にある物は、色とか大きさとかってプロパティがあります。
持つとか落ちるとかってメソッドがあります。
所有権世界にある物は、所有者とか値段とかってプロパティがあります。
売るとか買うとかってメソッドがあります。
世界が変わると、その物の背後に用意されてるプロパティとかメソッドがごっそり入れ替わるってことなんです。
これって、かなり大変な処理ですよね。
でも、そんなこと、全然気づいてないでしょ。
たとえば、「リンゴをレジに持って行って、お金を払って買いました」って文。
何もおかしくないし、普通に理解できるでしょ。
でも、この文、前半の「持つ」は3次元世界の話ですし、後半の「買う」は所有権世界の話です。
この一文を読む間に、脳は一瞬で世界を切り替えて処理してるんですよ。
凄いでしょ。
まぁ、でも、そんなことができるのは人間の脳だからですわ。
今のコンピュータじゃ、とても無理ですわ。
できるとしても、量子コンピュータかスーパーコンピュータですわ。
そう思いますよねぇ。
ところが、それが、パソコンでも出来るんですよ。
えっ、見たいですか?
わかりました。
そこまで言うのなら、お見せしましょう。
それができるのが、バージョンアップしたマインド・エンジンです。
と、前振りが長くなりましたけど、ここから、マインド・エンジンのデモをお見せします。
はい、これが、マインド・エンジンの全体像です。
構成は、前回と同じです
MindEngineコンソール、無意識、意識、仮想世界からなります。
前回と変わったのは、何と言っても仮想世界ですよね。
真っ黒になってますけど、これは、ここだけ、ゲームエンジンのUnityで作ってるからです。
今回は、3次元世界を実行するのでゲームエンジンを使ってます。
それでは、さっそく実行しますよ。
最初に入力する文は「スーパーがあります」です。
これを、MindEngineコンソールに入力して、実行ボタンを押します。
はい、仮想世界にスーパーが出現しましたよね。
ここに「三次元世界」って出てますよね。
マインド・エンジンが、三次元世界って認識したわけです。
細かい説明は後回しにして、どんどん行きますよ。
次に入力する文は「そこにはりんごが売っています」です。
実行します。
はい、仮想世界に所有権世界ってのが出現しましたよね。
これは、「売る」っていう動詞から、マインド・エンジンが、これは所有権世界の話だって判断して所有権世界を生成したわけです。
それから、注意して欲しいのは、さっきの三次元世界が小さくなって、所有権世界が大きくなりましたよね。
これが、世界の切り替わりです。
三次元世界から所有権世界に切り替わったわけです。
でも、三次元世界は消えたわけじゃありません。
切り替わったというより、二つの世界を認識してるけど、今は、所有権世界に注目してるって感じです。
この所有権世界で何を表示してるかも説明しておきますね。
左上の緑の丸にスーパーとりんごが表示されてますよね。
これは、所有権世界なんで、リンゴの所有者がスーパーだってことを表示してます。
右下の青い丸には少年がいますよね。
この少年が、じつは、マインド・エンジン自身を表してます。
どういうことかと言うと、マインド・エンジンって、人間の心を作ろうとしてます。
文章を読むとき頭で想像しますよね。
何か動作をする文なら、自分が動作するところを想像しますよね。
そこで、自分を用意してるってわけです。
どんどん行きますよ。
次は、「そのりんごは赤い」です。
はい、今度は三次元世界が大きくなりましたよね。
これは、物の色ってのは、三次元世界のことだからです。
色とか重さってプロパティを持ってるのは三次元空間に存在する物体ですよね。
だから、三次元世界に切り替わったんです。
次です。
次は「そのりんごの値段は300円です」
はい、今度は、所有権世界に切り替わりましたよね。
物の値段は、所有権世界の持つプロパティだからです。
所有権世界リンゴが「¥300」ってなりましたよね。
次です。
次は、「そのリンゴを手に持ちました」です。
はい、三次元世界に切り替わりましたよね。
「手に持つ」は、3次元世界の出来事ですから。
そして、少年がリンゴを手に持ちましたよね。
さっきも言いましたけど、この少年が、マインド・エンジン本人です。
次が最後です。
最後の文は「そのリンゴが手から落ちました」です。
実行するので、よく見ておいてくださいね。
はい、リンゴが落ちましたよね。
落ちたリンゴは、床にぶつかって、ちょっと跳ね返りましたよね。
ここで分かって欲しいのは、これはアニメーションを再生してるんじゃないんです。
ゲームエンジンの物理シミュレーターを使って、仮想物理空間で実際にリンゴを落としたところをシミュレーションしてるわけです。
さて、以上がバージョンアップしたマインド・エンジンです。
文を読んで、頭の中で想像するって、こういうことだってのは、分かったと思います。
ただ、これだけじゃ、どこがすごいのか、よく分からないですよね。
単に、3DCGで表現しただけにも見えますし。
今回お見せしたのは、意識が感じれる表面的な部分です。
重要なのは、意識が感じれない、裏で動いてる部分です。
無意識が行ってる処理です。
文章を読んで、その内容を、意識が頭の中で思い描くまでに、裏でどんな処理が行われてるか。
そっちの方が、はるかに多くの処理をしてるんです。
もし、その部分まで含めて、全体の処理が見えたら、僕の言いたいことが分かると思います。
これが、最初に言った話です。
つまり、言葉とか文法の処理は、最後の話だってことです。
その前に、目に見えない膨大な処理をしてるんです。
文の意味を理解する部分の処理です。
どう考えても、そっちの方が重要ですよね。
でも、そんな研究、誰もやってないんですよ。
やってない理由は単純です。
目に見えないからです。
単語とか、文法は目に見えるから研究しやすいんです。
でも、目に見えないからって重要じゃないわけないですよね。
たぶん、目に見えさえすれば、その重要性が誰にでも分かると思うんですよ。
それじゃぁ、それを見せようじゃないですか。
次回、そのあたりを、じっくりお見せししようと思ってますので、楽しみに待っていてくださいね。
はい、今回の動画が面白かったら、チャンネル登録、高評価お願いしますね。
それじゃぁ、次回も、おっ楽しみに!