第81回 言葉の意味を科学じゃ扱えないたった一つの理由


ロボマインド・プロジェクト、第81弾!
こんにちは、ロボマインドの田方です。

いったい、いつになったらできるんでしょうね。
ドラえもんとか、鉄腕アトムとか、友達になってくれるAIロボット。

なぜできないかというと、どうしても解決できない問題があるんです。
それは、会話です。
人が話す言葉のことを、AIでは自然言語って言いますけど、普通に人とおしゃべりできるAIって、本当に難しいんですよ。

科学の分野では、大きな目標を掲げて、それに向けてみんなで一気に実現するってこと、よくやります。
有名なんは、アポロ計画です。
1960年代に、人類を月に送りこむって宣言したのがケネディ大統領でした。
そして、見事、1969年に、人類は月に立ちました。

これと同じことは、自然言語処理でもよくやってます。
たとえば、アマゾンのAIスピーカー、アレクサのコンテストです。

2016年に開催したコンテストは、人間との雑談が20分以上続けられれば、なんと、賞金、1億5千万円も出すって言ってたんです。
アマゾン、何でそこまでするんでしょう。

ちょっと考えたらわかります。
自分の話を真剣に聞いてくれるAIですよ。
学校や会社から帰ってきたら、いろいろ話を聞いてもらいますよね。
そしたら、アレクサが答えてくれるんですよ。
そんな問題なら、便利な商品があるよ。
アマゾンに注文しといてあげるよって。
こうやって、日常生活から、心の中まで、アマゾンに支配されていくわけです。

でも、安心してください。
20分も会話が続くことはなかったです。
5分も会話が続かないのが、AIの現状です。

アポロ計画は成功したのに、なぜ、自然言語処理では、失敗するのでしょう?
じつは、ここには、現代科学が根本的に抱える問題があるんです。

アポロ計画が、なぜ、成功したかというと、基本的な技術が、すべてそろってたからです。
ロケットエンジンの仕組みとかです。
後は、どうやって月に着陸するかとか、大気圏の突入に耐えるには、どうすればいいかといった課題を、一つずつ解決していくわけです。
課題が、すべて、目に見えてるんですよ。

でも、自然言語処理は、そうじゃないんですよ。
目に見えてるのは、言葉だけなんですよ。
でも、人間が話をするとき、言葉がいきなり出るわけじゃないですよね。
頭の中で考えて、それを言葉にしてますよね。
つまり、自然言語処理を大きく二つに分けるとすると、文の内容と、その表現となるわけです。

会話をするとき、一番重要なのは、頭の中で考えてる内容ですよね。
それを表現したのが言葉です。
だから、同じ内容でも、人によって表現の仕方は違います。
でも、重要なのは話の内容です。
自然言語処理では意味理解になります。
言葉と意味理解、これが自然言語処理の2大課題といえます。

それでは、言葉と意味理解、自然言語処理で研究の割合は、どのぐらいかわかりますか?
50/50でしょうか?
それとも、意味理解が70%で、言葉が30%でしょうか?
これ、答えを聞いたらびっくりすると思いますけど、100/0なんですよ。
言葉の解析が100%で、意味理解が0%何ですよ。

あっ、誤解のないように言っておきますと、自然言語処理で意味理解の論文がないってことをいってるわけじゃないですよ。

自然言語処理でも、オントロジーとか、セマンティックWEBとか、言葉の意味に関する研究はいっぱいあります。
でも、どれも、言葉を言葉で定義することを前提としています。
あとは、その意味をWikipediaから取って来るとか、表現形式をXMLを使うかとか、そういった細かい議論がほとんどです。

でも、よく考えたら分かると思いますけど、これじゃ、意味を理解したことになってないんです。
たしかに、難しい言葉を、分かりやすい言葉に置き換えたら、理解しやすくなると思います。
でも、これって、あくまでも言葉を理解する対象が人間なんです。
コンピュータが、言葉の意味を理解するのとは別なんです。

会話プログラムを作るには、コンピュータそのものが言葉の意味を理解して、返事しないと、意味のある会話にならないんです。
コンピュータそのものが意味理解するにはどうしたらいいのかって観点から研究した自然言語処理の意味理解って、存在しないんです。
そんな論文は一本もないんです。

アポロ計画でいうと、ロケットエンジンをどうやって作ったらいいのか、分かってない状態です。
いや、ロケットエンジンってアイデアすら、まだない状態です。

そんな状態で、10年以内に月に行くぞって、いくらケネディ大統領が叫んでも、行けるわけないですよね。

でも、言葉を扱うAI技術はいっぱいありますよね。
たとえば、最近話題になった文章自動生成ツールにGPTってのがあります。
なんでも、あまりにも自然な文章を自動で作るので、危険すぎるってことで、公開が延期されたんです。

どうやってるかって言うと、機械学習をつかって、大量の文書データを学習させてわけです。
つまり、単語と単語が結びつく確率だけを計算して、単語を自動で繋げてるわけなんです。
だから、一見、自然な文章が作れるんです。
でも、言葉の意味なんか、全く考えてないので、よく読むと、あり得ないことも平気で言ってたりします。
だから、よく読んだら、AIが書いた文章だってすぐにバレるそうなんです。

それじゃぁ、言葉の意味を理解するのはどこでしょう?
それは、脳ですよね。
脳が言葉を生み出すわけです。

それじゃぁ、脳の研究成果をつかえば、言葉の意味理解もできそうです。
脳の研究なら、世界中でしてます。
でも、今の脳科学でわかってるのは、脳のどこで、言葉の処理してるかってことだけです。
どのように処理してるかって、肝心の処理の中身はわかってないんです。

中身って、どういうことでしょう?
それは、人が、頭の中で考えてることです。
今日、何食べようかなぁとか、
吉野家の牛丼、食べたいなぁとか。
でも、脳をいくら観察しても、吉野家の牛丼を食べてる映像は見えてきません。

頭の中で思い浮かべるもの、これは主観です。
この主観。
じつは、これは、科学じゃ、扱えないんです。
客観的に観測できなければ、科学は扱えないんです。
自然言語処理で科学的に扱えるもの、それは、表面に表れるテキストデータだけなんです。
だから、単語と単語が結びつく確率を計算するとか、言葉を別の言葉で言い換えるとか、それぐらいしかやれることがないんです。

科学っていうのは、細分化されてて、それぞれの分野で研究会があるわけです。
自然言語処理では、機械学習を使って、大量の文書データを解析する研究会とかなら、いっぱいあります。

でも、人間は、頭の中で、どうやって考えるのか、意味を理解するのかって、根本的なことを研究する研究会は存在しないんです。

素人が考えても、重要なのは、言葉の意味理解だって分かりますよね。
それを一切研究せずに、表面に表れる言葉だけを扱ってるのが、今の自然言語処理というわけです。

かなりいびつと言えますよね。
そうやってできた成果が、意味はないけど、自然に読める文章を自動で生成するツールなんです。

そんなツール、だれも望んでませんしね。
みんなが欲しいのは、意味が通じて、普通に会話できるAIです。

それができない原因が、言葉の意味を科学が扱えないってことだってことは理解できました。
それじゃぁ、科学意外に目を向ければ、言葉の意味を研究してる分野はありそうです。
たしかに、それはあります。
たとえば、哲学です。

それでは、次回は、哲学が扱う言葉について説明します。
そして、哲学の問題と、ロボマインド・プロジェクトは、いかにしてその問題を解決してるかについて、説明したいと思います。

興味ある人は、チャンネル登録もお願いします。

それでは、次回も、お楽しみに!