第10回 今まで誰も指摘しなかった言葉の本当の意味 〜言語学者じゃ絶対に分からない言葉の本当の意味


将棋のAIを作るのに、ルールを覚えさせへんなんて、
そんなヤツ、おらんやろ。

「いよ、海老蔵!」

ロボマインド・プロジェクト、第10弾
こんにちは、ロボマインドの田方です。

ようやく10回まで来ました。
今回で、一区切りがつきます。
ロボマインド・プロジェクトが、具体的に、何を作ろうとしてるかがやっと話せるんですね。

このシリーズ、最初から聞いてくれた皆さん、
いったい、いつになったらロボマインド・プロジェクトの話が始まるんだって
思ってなかったですか?

「東ロボくん」はダメだ、グーグルのBERTはダメだって、散々、ディスっといて、じゃぁ、ロボマインドは、どうなんだよって。

はい、今までの話は全て、前振りだったんです。
ロボマインド・プロジェクトって、あまりにも、世間とかけ離れたことをしてましてね、
いきなり、中身を話しても、
ん? いったい、なんでそんなことすんの?
って誰も理解できないみたいなんですよ。

20年前、このプロジェクトを思いついたとき、僕もね、最初は、図書館にこもって専門書や論文を読んでたんですよ。
でもね、いくら調べても、僕の知りたいことが見つからなかったんですよ。
言葉の意味をどうやってコンピュータで理解させるかとか、
そんな研究をしてる人すらいなかったんです。

そこで、本や論文を読むことを止めて、自分の頭で考えることにしたんですよ。
ちょうど、その頃、お金もなくなってきましてね。

出費を抑えるのに、一番効率的なのは、何か知ってます?
それはね、人付き合いをしないことなんですよ。
それで、人間関係を、一切絶つことにしたんですよ。
おかげで、研究する時間はたっぷり取れました。

人と一切会話せずに、何か月も過ごすなんてこと、普通にあったんですよ。
あっ、あんまり引かんといてくださいよ、ここ。

それで、言葉ってなんだ?っとか、ずっと考えてたんですよ。
頭のなかで考えるときも、言葉を一切使わない生活とか、してみたんですよ。

そんなことしてるとね、専門書や論文なんか読むより、よっぽと、気づきがあるんですよ。
たとえば、言葉がないと、時間って概念も生まれないんだ!とかね。

まぁ、時間の概念の話は、いずれするとしまして、とにかく、こんな風にして生まれたのがロボマインド・プロジェクトなんです。
外部と一切接触することなく、独自に進化したわけなんです。

だから、いきなり中身の話をしても、誰もついてこれないと思うんです。
それで、今話題のAIから入ったわけです。

「東ロボくん」には、なんの恨みもないです。

新井教授、本当にごめんなさい。
今でもね、「東ロボくん」で検索すると、Wikipediaの次に、僕のブログの記事が出てくるんですよ。

「東ロボくんは、なぜ失敗したのか」って記事なんですけどね。

このネタ、食いつきがいいんで、つい、使っちゃうんですよね。
ホント、ごめんなさい。

さて、それでは、本題に入ります。

前回は、機械学習できるものとできないものの違いの話でした。
機械学習できるものは、入力に対して、答えが一つに決まるものでした。
機械学習できないのは、答えが一つに決まらないものでした。
会話とか、そうでしたよね。

でも、例外があると言うところで終わりました。
入力に対して答えが決まらないのに、機械学習できるものがあるんです。

それは何かというと、チェスや囲碁、将棋といったゲームです。
将棋は、何手、何十手先まで読みながら次の一手を決めますよね。
だから、ある局面に対して、次の一手って、いろんな正解があるんです。

つまり、正解が一つに絞れないパターンになります。
これって、機械学習できないパターンです。
会話と同じです。

機械学習できるのは、画像認識みたいに、与えられた画像と、それに対する答えが一つに決まっている場合です。
猫が写ってる写真を見せて、猫って答えたら正解ってタイプの課題です。

将棋は、次の一手に複数の正解があって、機械学習できないタイプの課題です。
でも、将棋や囲碁って、ディープラーニングで人間のチャンピオンに勝ちましたよね。
なぜでしょう?

これが、今回のテーマとなります。
会話と将棋、共通点と違う点を考えていきましょう。

共通点は、正解が複数ある点ですよね。
違う点は、何でしょう?
それは、将棋には、目的とルールが明確に決まっているということです。

将棋の目的って、何でしょう?
それは、敵の王将を取ることですよね。
じゃぁ、ルールは、何でしょう?
それは、交互に指すとか、駒の動きとか、敵から取った駒は、自分の駒として使えるとか、そういったことです。

じゃぁ、会話はどうでしょう?
会話の目的ってなんでしょう?

会話にも、目的があるものと目的がないものがあります。
目的があるものって、たとえば、天気予報を教えてとか、道順を教えてとか、質問タイプの会話です。
そんな会話なら、既に今のAIで実現されています。

問題は、目的がないタイプの会話です。
それは何かというと、日常会話といった雑談です。

雑談って、なんとなくだらだら続きますよね。
特に、目的があってしゃべっているわけじゃないです。

では、ルールはどうでしょう?
会話には、ルールはあるでしょうか?
たぶん、文法って、ルールですよね。
じゃぁ、文法通りに文を作ればいいのかっていうと、そうでもないです。

「机の上に本がある」
これ、何もおかしくないですよね。
動詞「ある」は、他動詞なので、目的語を取ります。
目的語として取れるのは名詞です。
これが文法です。

じゃ、これはどうでしょう?
「机の上に春分の日がある」
全く意味がわかりませんよね。
想像できないです。
でも、文法的には問題ありません。
「春分の日」は名詞ですから、他動詞「ある」の目的語になれます。

文法は言葉のルールの一つですけど、これだけではダメなんです。
でも、将棋には、完全なルールがあるんです。
だから、機械学習できるんです。

もし、将棋のルールを無視して機械学習したらどうなるでしょう。
画像認識のように、表面に現れるデータだけで学習させるとします。
つまり、将棋の盤面の動きだけを学習させるわけです。
この盤面の場合、次に飛車をここに移動させる確率は何パーセントとか。
そういったことだけ学習させるわけです。

将棋ですから、相手の取った駒を使うこともできます。
そんな場合、ある盤面で、突然、駒が出現したりします。
それを、何も考えずに、この盤面ではここに飛車を置く確率何パーセントなんて学習するわけです。
そんな風に学習をしたAIと対戦したらどうなると思います。

「そんなとこ、勝手に飛車、置かれへんで」
「自分、飛車が3つになってるやん。どういうこと?」

もう、ムチャクチャですわ。
試合にならないですわ。
「自分、将棋するんやったら、まず、ルール覚えなあかんで」
そうなりますやん。

将棋のAIを作るのに、ルールを覚えさせへんなんて、
そんなヤツ、おらんやろ。

いやいや、あんた、それがホンマにおるんですわ。
そんなバカなことやってるのが、今の自然言語処理ですわ。

ルールも目的も考えんと、ただただ、この言葉とこの言葉が出てきたら、次にこの言葉が出てくる確率は何パーセントだ。
そんなことだけを延々と計算してるんですわ。

たとえば、「話は変わりますけど」って言葉がありますよね。
これに続く言葉ってなんでしょう?

そんなこと、分かるわけないですよね。

「話は変わりますけど、お母さんは、最近、元気にしておられますか?」かもしれません。
「話は変わりますけど、お腹壊したとき、薬、いっつも、何飲んでます?」かも知れません。

文脈とか、何も考えず、ただ、この言葉の次にこの言葉が出るとか、そんな計算だけして、何か意味があると思います?

将棋みたいな、簡単なゲームですら、きちんとルールがあるんです。
ルールを知らなかったら、ゲームにすらならないんですよ。
言葉なんて、もんのすごい複雑なルールがありそうって、ちょっと考えればわかりますよね。

語尾がちょっと変わるだけで、疑問文になったり、命令文になったりするんですよ。
過去の話か、未来の話かも、ちょっとした違いだけですわ。
相手に合わせて、尊敬語になったり、タメ口になったり。
こんなん間違ったら、国によったら、死刑になりますわ。

そりゃ、もう、どんでもなく複雑なルールがあるわけですよ。
僕らは、そんな複雑なルールを無意識で処理しながら、会話してるわけです。

機械学習で上手くいった例を、もう一度、考えてみましょ。
たとえば、画像認識です。
目と鼻と口があれば顔って判断する、それが画像認識です。

これって、顔の画像は、目、鼻、口の特徴パターンを含むってルールを自分で学習したってわけです。
そんなルールを教えなくても、AIが勝手にルールを学習したわけなんです。
その意味では、機械学習って、スゴイんです。

でも、これが成り立つのは、目、鼻、口で顔が作られるって、超単純なルールだから、学習できたんです。
まぁ、行ってみれば、たまたま上手くいっただけです。

これを見て、多くの研究者が、勘違いしてしまったんですよ。
データさえ集めれりゃ、上手くいくんだって。

それで、自然言語処理でも、大量の文書を学習させ始めたんですよ。
画像認識で上手くいったもんだから、その方法をそっくりまねたんですよ。

つまり、画像の特徴パターンを言葉に置き換えて、この言葉とこの言葉が出てきたら、この言葉が出てくる確率はどうだとか、そんなことだけを学習させたんですよ。

これっ、おかしいこと、わかりますよね。
だって、そのやり方、画像だからうまくいったんですよ。
目と鼻と口があれば、顔になる確率がかなり高いって、画像だから言えることなんです。

「話は変わりますが」って言葉がでてきて、次に続く言葉の確率なんか計算しても、なんの意味もないです。

でも、そんなバカな研究してるの、ごく一部でしょ。
そう思いますよね。

それが、この研究のトップを走ってるのは天下のグーグルです。
グーグルのBERTです。
ほんで、世界中の研究者も、それを必死で追い続けてるんですよ。

これが、今のAI業界がしでかしてることです。
早く気づけよって、ずっと思ってるんですけど、全然、気づかないんですよ。
誰も指摘しないから、仕方なく、こうして僕が説明してるんです。
これだけ分かりやすく説明したら、もう、分かりましたよね。

それでは、最後に、もう一度、おさらいします。
将棋にあって、会話にないもの。
それって何か。
そう、目的とルールです。

目的とルールさえわかれば、会話ができるAIができるんです。
これが答えです。
ルールを解明しようとすらせず、表面的な単語の数とかだけ数えても、何も解決しないんです。
でも、これが、今、世界中で行われてることです。

そして、世界で唯一、言葉のルールを解明したのが、ロボマインド・プロジェクトというわけです。

次回から、このロボマインド・プロジェクトの中身に入ろうと思いますけども、その前に、もう少しだけ、自然言語処理について説明しようと思います。

機械学習については十分、説明しましたけども、人工知能はそれだけじゃありません。
自然言語処理の分野は、50年以上にわたって、様々な取り組みが行われてきました。
それでも、未だに意味理解すらできていません。

やってないわけじゃなくて、現在も、様々な試みをしてはいるんです。
でも、僕に言わせたら、あーっ!、そっち、絶対行ったらアカンってとこやん。
その先、崖しかないのに!
って言わずにおれないんですよ。

次回は、そんな話をしたいと思います。
では、次回も、お楽しみに!