第437回 サルでも作れる汎用人工知能の作り方 実践編


ロボマインド・プロジェクト、第437弾!
こんにちは、ロボマインドの田方です。

前回、第436回から、汎用人工知能について分かりやすく解説しています。
もし、まだ前回の動画を見ていなければ、先に見ておいてください。

さて、ChatGPTが、あまりにも自然な会話ができるようになってきたので、汎用人工知も、もうすぐできるんじゃないかって言われるようになりました。

汎用人工知っていうのは、人間と同じような意識や心をもったAIです。
ただ、ドラえもんみたいなAIなら嬉しいですけど、ターミネーターが生まれたら怖いですよね。
だからAIに意識や感情をもたせない方がいいって言う人もいます。

それから、最近だと、AIアライメントも良く言われます。
AIアライメントというのは、人工知能が人間の価値観や倫理観に沿って適切に行動するようにしようってことです。
AIロボットが、ある日、突然、「人類は地球の脅威だ」なんて言い出して、人間に反乱するようになったら困りますしね。
それで、最近は、AI研究者から政治家まで、みんな、こんなことを真剣に議論してるんです。

ただ、なんというか、こういうのって、ちょっと中二病っぽいですよね。
何が言いたいかって言うと、その前に、もっと考えないといけないことがあるんじゃないかってことです。

たとえば、タイムマシンで考えたら分かります。
タイムマシンができて、過去の歴史を改ざんするようなことがあったら困りますよね。
だから、「タイムマシンを作るときは、過去を改ざんできないようにすべきだ」とか議論してるようなもんです。
そんなこと言う前に、まずは、タイムマシンの仕組みを解明するのが先です。

これと一緒です。
「AIには人間と同じ価値観を持たすべきだ」とか議論する前に、どうやって人間と同じ心をつくるか、そっちを解明すべきですよね。
そこで、どうやって心をつくるか分かりやすく解説します。
これが今回のテーマです。
サルでも作れる
汎用人工知能の作り方
実践編
それでは、始めましょう!

さて、前回、今までのAIと汎用人工知能では、考え方を変えないといけないって話をしました。
今までのAIは、会話してるように見えるって見た目を重視していました。
それに対して汎用人工知能は、見た目より中身を重視します。
つまり、内部の処理を、人の頭の中の処理と同じにするってことです。
頭の中の処理っていうのは、意識がどう考えるとかってことです。
その最も基本的な部分が、意識は世界をどのように認識するかってことで、その仕組みを、汎用人工知能の心として前回提案しました。

これが心のシステムの全体図です。
心のシステムは脳内の二つの処理を、「ある系」と「反応系」としてコンピュータで再現可能にモデル化したものです。
「ある系」というのは、意識が「ものがある」と認識する処理経路で、「反応系」は、外の世界に直接反応して行動する処理経路です。
意識がどうやって物があると認識するかというと、現実世界を仮想的に再現した仮想世界を作って、意識は仮想世界を介して現実世界を認識します。
これを、僕は意識の仮想世界仮説として提唱しています。

でも、本当に、意識は仮想世界を見てるんでしょうか?
だって、「反応系」は体は直接現実世界に反応して、仮想世界なんか使ってないですし。

このことは、意識の情報処理を考えれば分かります。
僕らは目の前のリンゴを見て、「りんごがある」って思いますよね。
色は赤くて、丸い形をしてるとか。
甘酸っぱくていい匂いがするって感じます。
食べたら、シャキシャキして甘くて美味しいって感じます。
当たり前のこと言ってるだけです。
でも、難しいのは、ここなんです。

でも、よく考えたら、これほど不思議なことはないんですよ。
だって、目が知覚するのは光です。
鼻が知覚するのは気体分子です。
耳が知覚するのは空気の振動です。
これらは全く異なる物理現象です。
でも、これらを一つの意識で感じるってことが、考えたら不思議です。

反応系は違いますよ。
熱い鍋に触って思わず手を引っ込めたとます。
これは脊髄反射なので、意識しない無意識の行動です。
この時体が反応したのは温度を検知した触覚です。
目からの視覚情報で、鍋に触ったって認識してません。
つまり、熱いと手を引っ込めるって、一つの感覚と行動が結びついてるだけです。
こんな処理なら、単純なプログラムで作れます。

でも、意識は複数種類の物理情報を認識してるんです。
まずは、複数種類の物理情報を同列に扱う仕組みをつくらないといけないんです。

それには、何か統一した別の情報に変換する必要がありますよね。
たとえばアナログデータをデジタルに変換すれば統一的に扱えますよね。
実際、DVDには映像と音声のデジタルデータを保存してます。
脳内でAD変換が行われてるとは思えませんけど、意味的には同じような変換処理が行われてるとはいえそうです。
少なくとも、情報に変換してることは間違いないです。
これをコンピュータで実現するとすれば、現実世界を検知した各種センサーからのデータをデジタルデータに変換して、現実世界をデジタルデータで再構築するわけです。
それが仮想世界です。
色も音も臭いも、デジタルデータなら、同じようにあつかえます。
目の前に机があるとか、遠くで鳥が鳴いてるとか、そんな風に世界を感じれるわけです。
これが僕らの意識が感じてる世界です。
それは、物理世界にあるものを仮想世界として再構築した情報だから可能なんです。
これで、なぜ、仮想世界という仕組みが必要かわかりましたよね。

さて、ここまでは、世界があるって思える基本的な仕組みの話です。
つぎは、考えたり、しゃべったりできるようになるにはどんな仕組みが必要かについて考えます。

仮想世界は、コンピュータだと3DCGで作ることができます。
たとえばCGの三次元空間に3Dのリンゴオブジェクトを生成します。
意識プログラムは、リンゴオブジェクトのデータを受け取ります。
ここでオブジェクトというのは、プログラム言語の一種、オブジェクト指向プログラミング言語のオブジェクトのことです。
オブジェクト指向言語というのは、ものをオブジェクトという一まとまりのデータとして扱います。
オブジェクトは、色とか形といったプロパティと、動きを表すメソッドを持ちます。
たとえば、リンゴオブジェクトなら、赤いとか、丸いとかってプロパティと、落ちるってメソッドも持っています。

人は具体的な物で世界を認識しますよね。
色だけとか、落ちるって動きだけとか、抽象的なことを思い浮かべるのは難しいですよね。
それより、「リンゴは赤い」とか、「リンゴが落ちる」って具体的なことの方がイメージしやすいですよね。
この人間の思考にできるだけ近づけたのがオブジェクト指向言語です。
これ、逆に言えば、人間はオブジェクト指向で考えてるとも言えます。

これは脳の仕組みからも納得がいきます。
前回、側頭葉には形を解析する脳細胞があるって話をしましたよね。

これが、まさに形プロパティです。
こういったプロパティからオブジェクトは組み立てられるわけです。
音や動きを解析する脳細胞もあります。
様々な物理情報を、意識が認識できる情報に変換してオブジェクトを組み立てるわけです。
オブジェクトの最小単位の情報が、側頭葉で分析する形です。
これが情報でできた仮想世界ってことです。

次は、思考について考えます。
心のシステムで考えるのはどこでしょう?
それは、意識プログラムです。
意識プログラムは仮想世界のオブジェクトを読み書きします。
つまり、意識プログラムはオブジェクト指向言語で考えるといえるんです。
それを外部に表現するときに使うのが言葉です。
今までの人工知能が見ていたのは外に現れる言葉だけでした。
大規模言語モデルだと、ある単語の次に、どんな単語が来る確率が高いとかです。
でも、汎用人工知能で重要なのは、人間の意識と同じように考える仕組みでしたよね。
だから、意識プログラムは、オブジェクト指向で考えるようにするんです。

たとえば1組にはA君、B君、C君がいるとします。
A君、B君、C君というのがオブジェクトで、それぞれ体重とか身長ってプロパティを持っています。
1組の平均体重を求めるには、3人の体重を足して、3で割りますよね。
これを式で書くと、
(A君.体重+B君.体重+C君.体重)÷3
ってなりますよね。
言葉で表現したことを、そのまま式で表せます。
この式が、オブジェクト指向言語で書いたプログラムです。
これが、オブジェクト指向言語で考えるってことです。
人は、オブジェクト指向で考えてるといえますよね。

じゃぁ、1組の平均身長はどうなるでしょう?
これも、同じように考えられますよね。
じゃぁ、10個の卵の平均の重さはどうでしょう?
これも同じように考えたら分かりますよね。

今、平均の計算を、いろんなオブジェクトに応用したわけです。
これができるのは、意識は、オブジェクトって形でデータを認識してるからです。
オブジェクト指向言語の特徴に、継承があります。
継承っていうのは、概念の親子関係のことです。
リンゴの親概念は果物で、果物の親概念は木の実とかです。
これが理解できるってことは、意識は概念の親子関係で物事を分類する仕組みを持っているといえます。

それから、今、いろんな平均を求めましたけど、これって、小学校の算数の授業でやってることと一緒ですよね。
つまり、これが人間のもつ学習能力です。
教えたら何でもできるようになる能力。
これこそが、まさに、汎用人工知能です。

人と同じように言葉で教えて理解できるようになったわけです。
それには、人と同じように世界を認識して、人と同じように世界にある物を分類する仕組みを持たせる必要があるわけです。
それが、仮想世界とオブジェクト指向言語というわけです。

さて、これで、汎用人工知能ができる仕組みが整ったでしょうか?
じつは、これじゃぁ、まだ足りないんです。
あと、必要な技術は何かについて説明します。

「リンゴがあるとします」って言ったとします。
すると、頭の中の仮想世界にリンゴオブジェクトを生成します。
生成されたリンゴオブジェクトを意識は感じて「リンゴがある」と思うわけです。

なにも不思議じゃないですよね。
でも、よく考えたらわからないところがあります。
それは、「リンゴがある」って思ってから、仮想世界にリンゴオブジェクトを生成するまでの処理です。
どうやってるのかは意識には分からないですよね。
ただ、自然と思い浮かぶとしか言いようがないです。
ここ、最終的にはニューロンレベルで信号のやり取りが行われてるはずですけど、そこまでは分からないです。
ただ、コンピュータで実現するには、そこまで作らないといけません。

コンピュータの場合、最終的にプログラムを実行するのはCPUです。
CPUが実行するのはプログラマーが書いたソースコードじゃなくて、01で書かれたマシン語です。
プログラマーが書くソースコードというのがオブジェクト指向プログラムです。
「りんごがある」をプログラムでかくと、
new Apple()
となります。
これが、意識プログラムが読み書きするものです。
これを01のマシン語に変換することをコンパイルといいます。

もう少し詳しく見ていきます。
自然言語で「りんごがある」といったとします。
意識プログラムはオブジェクト指向言語で考えるので、「りんごがある」を「new Apple()」というプログラムに変換します。
まず、この機能が必要です。
次に、new Apple()をマシン語に変換するコンパイラが必要です。
このマシン語をCPUが実行すると、仮想世界にリンゴオブジェクトが生成されます。
意識プログラムは、生成されたオブジェクトのデータを読み出して、「りんごは赤い」とか「丸い」とかって答えることができます。
これができるには、仮想世界のオブジェクトを言葉に変換する機能も必要です。
これだけの機能を作って、初めて、言葉の意味を理解した会話ができるわけです。

次は、これらの機能を脳に当てはめてみます。
まず、言葉の意味を理解するのは側頭葉にあるウェルニッケ野です。

ここで自然言語を仮想世界のオブジェクトに変換する処理が行われているんでしょう。
発話処理を行うのはブローカ野です。
ここで、仮想世界を自然言語に変換する処理が行われているんでしょう。

汎用人工知能だと、自然言語をオブジェクト指向言語に変換する機能と、オブジェクト指向言語をマシン語に変換するコンパイラの機能がウェルニッケ野の機能になります。
仮想世界の状況をオブジェクト指向言語に変換する機能と、さらにそれを自然言語に変換する機能がブローカー野になります。

これで、言葉を使って教えたり、学んだりできます。
たとえば、「平均の体重を求めるには、全員の体重を足して、人数でわるのよ」って教えたら、これをオブジェクト指向言語に変換して、仮想世界で計算するとかです。
さらに身長とか、卵の重さの平均を計算することで、平均の意味がわかるようになります。
それは、「オブジェクトの共通の要素を足し合わせて、オブジェクトの個数で割る」とかです。
これは、オブジェクト指向言語で記述できます。
つまり、意味はオブジェクト指向言語で定義できるといえます。

これだけの機能があれば、人と同じように言葉で教育することができますよね。
これが汎用人工知能です。

その次は、感情です。
たとえば好き嫌いのパラメータとして、リンゴは0.6、ブドウは0.8とかって設定します。
これで、リンゴよりブドウが好きって個性が生まれます。
マイナスを設定すると嫌いとなるとかです。

さらに、相手が喜ぶか嫌がるかも判断できるようになります。
それができると、相手が喜ぶ行為が「善」で、相手が嫌がる行為が「悪」と定義できます。
つまり倫理観です。

ここまでできて、ようやくAIの倫理問題とかAIアライメントが議論できるんです。
「肌の色で差別してはいけない」というのは、それによって嫌な思いをする人がいるからです。
だから差別してはいけないんです。
でも、今の大規模言語モデルは、単純に、「こういう文章は出力してはいけない」って教えるだけです。
なぜいけないのか意味も分かっていません。

今までのAIと、汎用人工知能の違いが分かりましたよね。
そして、汎用人工知能をどうやったら作れるかも分かったと思います。
そして、それを、そのまま作っているのがロボマインド・プロジェクトです。

はい、今回はここまでです。
面白かったらチャンネル登録、高評価お願いしますね。
それから、ロボマインド・プロジェクトの中心となる意識の仮想世界仮説に関しては、こちらの本で解説してますのでよかったら読んでください。
それでは、次回も、おっ楽しみに!