機械学習には、出来ることと、出来ないことがあるんです。
そんな基本的なことが分かってない人が多すぎるんです。
そういう人に限って、上手くいかないと、すぐにデータが足りないからだって言うんですよ。
ロボマインド・プロジェクト、第9弾
こんにちは、ロボマインドの田方です。
AIに会話をさせるのは、実は、めちゃくちゃ難しいって、そこまで、前回、お話しましたよね。
今回は、AIは何が得意で、何が苦手かについてお話したいと思います。
この場合のAIって、機械学習のことです。
機械学習のなかで、一番有名なのが、今はやりのディープラーニングです。
さて、機械学習で上手くいったものと言えば、画像認識とか、文章の穴埋め問題です。
画像認識で学習するとき使うのは、写真と、そこに何が写ってるかの答えです。
穴埋め問題を学習するとき使うのは、一部を隠した文章と、その隠された答えです。
これらに共通するのは、問題と答えが一対一に対応しているってことです。
ある画像に対する正解が一つに決まっています。
空欄に入る単語も一つに決まっています。
正解が決まっているから、学習できるんです。
問題と答えのペアさえあれば、それを大量に用意して、学習させれば、正解を答えれるようになります。
重要なのは、大量のデータ、いわゆるビッグデータです。
これが、今のAIです。
逆に言うと、今のAIが苦手なのは、正解がないタイプの問題となります。
一つの問題に、正解がいくつもあると、学習することができません。
その典型的なのが会話です。
たとえば、家族会議で、こんな親子の会話があったとします。
息子が、こう言ったとします。
「お父さん、報告があります。
じつは、大学入試に落ちてしまいました」
それに対して、父親は、こう答えるかもしれません。
「そうか。
だから、あれほど勉強しろって言ったじゃないか。
遊んでばかりいるから、こんな結果になるんだ」
または、こんな風に答えるかもしれません。
「そうか。
お父さんも、一度、受験に失敗したんだよ。
1年浪人して、必死で頑張って、志望大学に行けたんだよ。
お前も、後、1年がんばってみるか」
もしかしたら、こんな答えかもしれません。
「そうか。
お父さんは、最近、思うんだよ。
大学だけが人生じゃないって。
無理して大学目指さなくてもいいんじゃないか」
もう、いろんな答えが考えられるわけですよ。
それこそ、答えなんて、無限にあるわけです。
無限に答えがあるなら、何を答えてもいいのでしょうか?
間違った答えなんて、あるんでしょうか?
たとえば、こんな風にお父さんが答えたらどうでしょう。
「そうか。
実は、お父さんも、報告しなきゃいけないことがあるんだ。
一階の、あまり使ってない押し入れがあるだろう。
三日ほど前、たまたま開けてみいたら、そこに知らないおじさんが住んでいたんだよ」
お母さんは、びっくりするでしょう。
「えーっ、何で、そんなこと今まで黙ってたのよ」
妹は泣きそうです。
「えー、怖いよぉ」
息子はきっと、こう思うでしょう。
「親父、なんで、今、そんな話すんだよ!
今は、俺の時間だろ!
俺のこと、心配する時間だろ!」
息子の言う通りです。
これは、今、言うべきことじゃないです。
たとえば、ご飯のときとか、
いや、おじさんを見つけたとき、すぐに言うべきだったんです。
いやいや、その話は、もういいです。
とにかく、受験の失敗を告げる息子への返答としては、間違っています。
僕が言いたいこと、分かりますよねぇ。
ちょっと、これ、たとえが、良くなかったかもしれないですね。
たとえが強すぎて、肝心の言いたいことが、どうも、ちゃんと伝わりにくいですよねぇ。
あの、押し入れのおじさんのことは、今は、ちょっと、忘れといてください。
重要なのは、そっちじゃなくて、AIに会話は難しいって話です。
会話って、何でも答えりゃええって、そういうわけじゃないんですよ。
考えたら、ちょっと怖いですよねぇ。
夜中にね、勝手に冷蔵庫の残りもんとか、食べてたそうなんですよ。
いや、だから、おじさんの話は置いときましょ。
そっちじゃないです。
AIの話です。
トイレとか、どうしてたんでしょうね。
だから、もう、ええっちゅうに。
はい、AIの話に戻りますよ。
会話は、AIには難しいって話です。
それは、なぜかって話です。
機械学習って、正解に出来るだけ近づくように、大量のデータから、パラメータを最適化するんです。
これができるのは、入力に対して、答えが一つに決まってる場合に限るわけです。
たとえば、
この写真に写っている動物は何でしょう?
答えは「犬」ですよね。
「猫」とか「カバ」とか答えたら、間違いですよね。
入力された問題に対する答えが決まってること。
機械学習する上で、これは、絶対、守らないといけないことなんです。
同じ画像を入れても、あるときは、犬、ある時は猫が正解なら、学習のしようがないんです。
できないのは、入力に対する答えが決まらない場合です。
それが、会話です。
「大学入試に落ちました」って入力に対して、答えは一つじゃありません。
だから、入力文と、その答えから成る大量のデータを用意しても、学習できないんです。
「大学入試」「落ちる」って入力があれば、○○と返答すれば正解って決まるわけじゃないんです。
画像認識なら、目と鼻があれば顔だってわかります。
でも、会話は、そんな単純な話じゃないんです。
会話でなければ、自然言語処理でも、機械学習は有効です。
穴埋め問題なんかは、答えが一つに決まるから、機械学習できるんです。
それから、翻訳もです。
翻訳は、これが完全に正解だって答えはないですけども、ある程度、答えは絞られます。
入力と答えのばらつきは、会話ほどはありません。
だから、データ量を増やせば増やすほど、精度が高くなるんです。
昔の翻訳ソフトに比べて、最近のグーグル翻訳が格段に、精度が上がったのも、機械学習のおかげなんです。
入力がきまれば答えが決まる。
そういったタイプの課題は機械学習が有効。
でも、こんな基本的なことが分かってない人が多いんです。
上手くいかないと、データが足りないからだって、すぐに言うんですよ。
そういう場合もありますけど、そうじゃない場合もあるんです。
それが、会話です。
会話文なんて、WEB上にいくらでもあります。
グーグルは、そんなデータを無限にもっています。
そんなグーグルでも、未だに会話ができるAIができない理由は、会話は、機械学習できないからなんです。
でも、実は、例外があるんです。
入力が決まっても、答えが一つに決まらないのに、機械学習が上手くいくものもあるんです。
ちょっと、今までの話と矛盾するかもしれませんけども、これが分かると、会話の難しさが、どこにあるか、もっとはっきりするんです。
次回は、その話をしたいと思います。
それでは、次回もお楽しみに!