将棋のAIを作るのに、ルールを覚えさせへんなんて、
そんなヤツ、おらんやろ。
「いよ、海老蔵!」
ロボマインド・プロジェクト、第10弾
こんにちは、ロボマインドの田方です。
ようやく10回まで来ました。
今回で、一区切りがつきます。
ロボマインド・プロジェクトが、具体的に、何を作ろうとしてるかがやっと話せるんですね。
このシリーズ、最初から聞いてくれた皆さん、
いったい、いつになったらロボマインド・プロジェクトの話が始まるんだって
思ってなかったですか?
「東ロボくん」はダメだ、グーグルのBERTはダメだって、散々、ディスっといて、じゃぁ、ロボマインドは、どうなんだよって。
はい、今までの話は全て、前振りだったんです。
ロボマインド・プロジェクトって、あまりにも、世間とかけ離れたことをしてましてね、
いきなり、中身を話しても、
ん? いったい、なんでそんなことすんの?
って誰も理解できないみたいなんですよ。
20年前、このプロジェクトを思いついたとき、僕もね、最初は、図書館にこもって専門書や論文を読んでたんですよ。
でもね、いくら調べても、僕の知りたいことが見つからなかったんですよ。
言葉の意味をどうやってコンピュータで理解させるかとか、
そんな研究をしてる人すらいなかったんです。
そこで、本や論文を読むことを止めて、自分の頭で考えることにしたんですよ。
ちょうど、その頃、お金もなくなってきましてね。
出費を抑えるのに、一番効率的なのは、何か知ってます?
それはね、人付き合いをしないことなんですよ。
それで、人間関係を、一切絶つことにしたんですよ。
おかげで、研究する時間はたっぷり取れました。
人と一切会話せずに、何か月も過ごすなんてこと、普通にあったんですよ。
あっ、あんまり引かんといてくださいよ、ここ。
それで、言葉ってなんだ?っとか、ずっと考えてたんですよ。
頭のなかで考えるときも、言葉を一切使わない生活とか、してみたんですよ。
そんなことしてるとね、専門書や論文なんか読むより、よっぽと、気づきがあるんですよ。
たとえば、言葉がないと、時間って概念も生まれないんだ!とかね。
まぁ、時間の概念の話は、いずれするとしまして、とにかく、こんな風にして生まれたのがロボマインド・プロジェクトなんです。
外部と一切接触することなく、独自に進化したわけなんです。
だから、いきなり中身の話をしても、誰もついてこれないと思うんです。
それで、今話題のAIから入ったわけです。
「東ロボくん」には、なんの恨みもないです。
新井教授、本当にごめんなさい。
今でもね、「東ロボくん」で検索すると、Wikipediaの次に、僕のブログの記事が出てくるんですよ。
「東ロボくんは、なぜ失敗したのか」って記事なんですけどね。
このネタ、食いつきがいいんで、つい、使っちゃうんですよね。
ホント、ごめんなさい。
さて、それでは、本題に入ります。
前回は、機械学習できるものとできないものの違いの話でした。
機械学習できるものは、入力に対して、答えが一つに決まるものでした。
機械学習できないのは、答えが一つに決まらないものでした。
会話とか、そうでしたよね。
でも、例外があると言うところで終わりました。
入力に対して答えが決まらないのに、機械学習できるものがあるんです。
それは何かというと、チェスや囲碁、将棋といったゲームです。
将棋は、何手、何十手先まで読みながら次の一手を決めますよね。
だから、ある局面に対して、次の一手って、いろんな正解があるんです。
つまり、正解が一つに絞れないパターンになります。
これって、機械学習できないパターンです。
会話と同じです。
機械学習できるのは、画像認識みたいに、与えられた画像と、それに対する答えが一つに決まっている場合です。
猫が写ってる写真を見せて、猫って答えたら正解ってタイプの課題です。
将棋は、次の一手に複数の正解があって、機械学習できないタイプの課題です。
でも、将棋や囲碁って、ディープラーニングで人間のチャンピオンに勝ちましたよね。
なぜでしょう?
これが、今回のテーマとなります。
会話と将棋、共通点と違う点を考えていきましょう。
共通点は、正解が複数ある点ですよね。
違う点は、何でしょう?
それは、将棋には、目的とルールが明確に決まっているということです。
将棋の目的って、何でしょう?
それは、敵の王将を取ることですよね。
じゃぁ、ルールは、何でしょう?
それは、交互に指すとか、駒の動きとか、敵から取った駒は、自分の駒として使えるとか、そういったことです。
じゃぁ、会話はどうでしょう?
会話の目的ってなんでしょう?
会話にも、目的があるものと目的がないものがあります。
目的があるものって、たとえば、天気予報を教えてとか、道順を教えてとか、質問タイプの会話です。
そんな会話なら、既に今のAIで実現されています。
問題は、目的がないタイプの会話です。
それは何かというと、日常会話といった雑談です。
雑談って、なんとなくだらだら続きますよね。
特に、目的があってしゃべっているわけじゃないです。
では、ルールはどうでしょう?
会話には、ルールはあるでしょうか?
たぶん、文法って、ルールですよね。
じゃぁ、文法通りに文を作ればいいのかっていうと、そうでもないです。
「机の上に本がある」
これ、何もおかしくないですよね。
動詞「ある」は、他動詞なので、目的語を取ります。
目的語として取れるのは名詞です。
これが文法です。
じゃ、これはどうでしょう?
「机の上に春分の日がある」
全く意味がわかりませんよね。
想像できないです。
でも、文法的には問題ありません。
「春分の日」は名詞ですから、他動詞「ある」の目的語になれます。
文法は言葉のルールの一つですけど、これだけではダメなんです。
でも、将棋には、完全なルールがあるんです。
だから、機械学習できるんです。
もし、将棋のルールを無視して機械学習したらどうなるでしょう。
画像認識のように、表面に現れるデータだけで学習させるとします。
つまり、将棋の盤面の動きだけを学習させるわけです。
この盤面の場合、次に飛車をここに移動させる確率は何パーセントとか。
そういったことだけ学習させるわけです。
将棋ですから、相手の取った駒を使うこともできます。
そんな場合、ある盤面で、突然、駒が出現したりします。
それを、何も考えずに、この盤面ではここに飛車を置く確率何パーセントなんて学習するわけです。
そんな風に学習をしたAIと対戦したらどうなると思います。
「そんなとこ、勝手に飛車、置かれへんで」
「自分、飛車が3つになってるやん。どういうこと?」
もう、ムチャクチャですわ。
試合にならないですわ。
「自分、将棋するんやったら、まず、ルール覚えなあかんで」
そうなりますやん。
将棋のAIを作るのに、ルールを覚えさせへんなんて、
そんなヤツ、おらんやろ。
いやいや、あんた、それがホンマにおるんですわ。
そんなバカなことやってるのが、今の自然言語処理ですわ。
ルールも目的も考えんと、ただただ、この言葉とこの言葉が出てきたら、次にこの言葉が出てくる確率は何パーセントだ。
そんなことだけを延々と計算してるんですわ。
たとえば、「話は変わりますけど」って言葉がありますよね。
これに続く言葉ってなんでしょう?
そんなこと、分かるわけないですよね。
「話は変わりますけど、お母さんは、最近、元気にしておられますか?」かもしれません。
「話は変わりますけど、お腹壊したとき、薬、いっつも、何飲んでます?」かも知れません。
文脈とか、何も考えず、ただ、この言葉の次にこの言葉が出るとか、そんな計算だけして、何か意味があると思います?
将棋みたいな、簡単なゲームですら、きちんとルールがあるんです。
ルールを知らなかったら、ゲームにすらならないんですよ。
言葉なんて、もんのすごい複雑なルールがありそうって、ちょっと考えればわかりますよね。
語尾がちょっと変わるだけで、疑問文になったり、命令文になったりするんですよ。
過去の話か、未来の話かも、ちょっとした違いだけですわ。
相手に合わせて、尊敬語になったり、タメ口になったり。
こんなん間違ったら、国によったら、死刑になりますわ。
そりゃ、もう、どんでもなく複雑なルールがあるわけですよ。
僕らは、そんな複雑なルールを無意識で処理しながら、会話してるわけです。
機械学習で上手くいった例を、もう一度、考えてみましょ。
たとえば、画像認識です。
目と鼻と口があれば顔って判断する、それが画像認識です。
これって、顔の画像は、目、鼻、口の特徴パターンを含むってルールを自分で学習したってわけです。
そんなルールを教えなくても、AIが勝手にルールを学習したわけなんです。
その意味では、機械学習って、スゴイんです。
でも、これが成り立つのは、目、鼻、口で顔が作られるって、超単純なルールだから、学習できたんです。
まぁ、行ってみれば、たまたま上手くいっただけです。
これを見て、多くの研究者が、勘違いしてしまったんですよ。
データさえ集めれりゃ、上手くいくんだって。
それで、自然言語処理でも、大量の文書を学習させ始めたんですよ。
画像認識で上手くいったもんだから、その方法をそっくりまねたんですよ。
つまり、画像の特徴パターンを言葉に置き換えて、この言葉とこの言葉が出てきたら、この言葉が出てくる確率はどうだとか、そんなことだけを学習させたんですよ。
これっ、おかしいこと、わかりますよね。
だって、そのやり方、画像だからうまくいったんですよ。
目と鼻と口があれば、顔になる確率がかなり高いって、画像だから言えることなんです。
「話は変わりますが」って言葉がでてきて、次に続く言葉の確率なんか計算しても、なんの意味もないです。
でも、そんなバカな研究してるの、ごく一部でしょ。
そう思いますよね。
それが、この研究のトップを走ってるのは天下のグーグルです。
グーグルのBERTです。
ほんで、世界中の研究者も、それを必死で追い続けてるんですよ。
これが、今のAI業界がしでかしてることです。
早く気づけよって、ずっと思ってるんですけど、全然、気づかないんですよ。
誰も指摘しないから、仕方なく、こうして僕が説明してるんです。
これだけ分かりやすく説明したら、もう、分かりましたよね。
それでは、最後に、もう一度、おさらいします。
将棋にあって、会話にないもの。
それって何か。
そう、目的とルールです。
目的とルールさえわかれば、会話ができるAIができるんです。
これが答えです。
ルールを解明しようとすらせず、表面的な単語の数とかだけ数えても、何も解決しないんです。
でも、これが、今、世界中で行われてることです。
そして、世界で唯一、言葉のルールを解明したのが、ロボマインド・プロジェクトというわけです。
次回から、このロボマインド・プロジェクトの中身に入ろうと思いますけども、その前に、もう少しだけ、自然言語処理について説明しようと思います。
機械学習については十分、説明しましたけども、人工知能はそれだけじゃありません。
自然言語処理の分野は、50年以上にわたって、様々な取り組みが行われてきました。
それでも、未だに意味理解すらできていません。
やってないわけじゃなくて、現在も、様々な試みをしてはいるんです。
でも、僕に言わせたら、あーっ!、そっち、絶対行ったらアカンってとこやん。
その先、崖しかないのに!
って言わずにおれないんですよ。
次回は、そんな話をしたいと思います。
では、次回も、お楽しみに!