ロボマインド・プロジェクト、第155弾!
こんにちは、ロボマインドの田方です。
前回、第154回「世界初!心の特許」では、特許制度の説明で終わってしまいました。
今回は、特許の中身の話をしますよ。
「心の特許」っていったい何?
心で特許なんか、取れるの?
それ、儲かるの?
たぶん、いっぱい疑問があると思います。
今回は、それに全部、答えます。
まずは、特許の概要から説明します。
今回取得したのは、人間が頭の中で考えるのと同じように考える仕組みの部分です。
あぁしたらどうだろう、こうしたらどうかなって考える仕組みです。
たとえば、第100回「待たせたな、これが心のプログラムだ」では、子ブタちゃんとオオカミの物語を例にあげて説明しました。
オオカミが現れた時、子ブタちゃんが、大岩の後ろに隠れようか、家の中に隠れようか、いろいろ考えます。
大岩の後ろに隠れたら、見つかったら食べられるぞ。
家の中なら、オオカミは入ってこれないから安全だぞって考えて、最終的に家に隠れることに決めました。
このとき、子ブタちゃんは、頭の中でいろんな場合をシミュレーションしたわけです。
シミュレーションして行動を決定するってのが、人間の考え方ってわけです。
人間と普通に会話できるロボットを作ろうと思ったとき、どうしても、この機能はいるだろうと思って特許を取ったわけです。
「そんなことで、特許が取れるの?」って思いますよね。
たぶん、一般の人なら、そう思います。
でも、AIの専門家は、そんな風に考えないんですよ。
どう考えるかって言うと、大量の文書や画像を学習させるんです。
学習って何かっていうと、この入力が来たらこう出力したら正解ってことです。
これが、今のAI、つまり機械学習とかディープラーニングです。
オオカミの単語の近くには子ブタって単語が出る確率は何%、赤ずきんちゃんって単語が出る確率は何%って学習するだけです。
意味なんか考えてないし、まして、こうしたらどうなるだろうなんてシミュレーションしようなんて考えてもいません。
これが今のAIなんです。
その証拠に、今回の特許、審査しても、引用文献が一件も挙げられなかったんですよ。
AIの専門家は、本当に、全く考えてなかったみたいなんです。
正直、これには、僕が一番びっくりしたんですけどね。
でも、そうなると本当に実現できるのかって疑問がでてきますよね、。
それに対しては、第100回の動画を見てもらうのが一番早いです。
そこでは、実際に動くシステムのデモをお見せしてるので、実現可能なことは分かると思います。
概要の話はこのぐらいにして、次は、いよいよ、特許の中身の話です。
特許書類って、大きく「明細書」と「特許請求の範囲」に分かれます。
特許文書のほとんどは、明細書で、普通の言葉で、具体的な使い方の説明が書いてあります。
「特許請求の範囲」は、1~2ページの短い書類なんですけど、はっきり言って、普通の日本語で書いてなくて、何を書いてるのか意味が分からないんです。
だから、普通の人は明細書だけを読みます。
でも、前回も言いましたけど、一番重要なのは、「特許請求の範囲」です。
「特許請求の範囲」を読み解かないと、その特許がどれだけの影響力があるのか分かりません。
なので、まずは、「特許請求の範囲」を全て読みます。
さっと読んでも、意味が分からないと思うので、その後、重要な所をピックアップして説明します。
それでは、読みますよ。
【書類名】特許請求の範囲
【請求項1】
外部から入力された情報に基づいて、外部への出力を決定する人工知能システムであって、
人および人の思考を模したデータモデルを予め記憶する記憶部と、
前記記憶部から前記データモデルを取り出し、人の動作および思考を再現可能な人オブジェクトを生成する生成部と、
前記人オブジェクトが配置される第1のプラットフォームおよび第2のプラットフォームを有し、人オブジェクトの動作および思考が展開される3次元仮想世界を構築する世界構築部と、
前記外部から入力された情報に基づいて、前記人オブジェクトを前記第1のプラットフォームに配置して、現実世界を再現する外部世界再現部と、
前記第1のプラットフォームに再現された前記3次元仮想世界を認識することによって前記現実世界を把握するとともに、前記第2のプラットフォームに前記人オブジェクトを配置し、操作することにより、前記外部への出力を決定する出力決定部と、を備える、人工知能システム。
はい、以上が「特許請求の範囲」です。
どうです?
何言ってるのか、よく、わからないでしょう。
その一番の原因は、これだけの長い文を、たった一文で書いてるからです。
いくつかの文に分けたら、まだ、読みやすくなるのに、一文で書くんですよ。
これ、昔からの、特許業界の悪しき慣習なんですよ。
別に、特許法で決まってるわけでもなくて、特許庁も、一文で書く必要ないって指針を示してるんですけどね。
こういうの、ほんと、止めてよしいですよね。
それじゃぁ、順番に読み解きますよ。
まず最初の文
「外部から入力された情報に基づいて、外部への出力を決定する人工知能システム」
これです。
いきなり、何かよくわからない文章になってますよね。
まず分かっておかないといけないのは、特許の目的です。
それは、その製品を作れるのは、できるだけ、自分だけにしたいってことです。
ライバル会社に作らせないようにするってことです。
そのために、出来るだけ、広い特許をとるわけです。
この観点から、特許を読み解くってのが、ものすごく重要なんです。
じゃぁ、行きますよ。
「外部から入力された情報」
この表現、ものすごく曖昧ですよね。
情報って、映像でもいいし、音声でもいいし、文章でもいいわけです。
つまり、ドラえもんみたいなロボットを作って、目から映像を取り込んでる場合でもいいし、音声で会話するスマホアプリでもいいし、キーボードから文字を入力するチャットボットでもいいわけです。
こうやって、出来るだけ幅広い権利を取ろうとするわけです。
そうすると、結果として、読みにくい、何が言いたいのかわからない文章になってしまうんです。
次、行きますよ。
「外部への出力を決定する」です。
ここも注意して読んでください。
どこを注意するかっていうと「出力を決定する」ってなっていますよね。
ここで言う出力ってのは、ロボットの場合、行動とか発言です。
チャットボットの場合、返答です。
注意して欲しいのは、そこじゃなくて、「決定する」です。
どういうことかって言うと、「出力する」じゃないんです。
「決定する」なんです。
つまり、実際に行動したり、発言や、返答しなくてもいいんです。
入力情報を処理して、出力せず、記録するだけのシステムも含まれるってことです。
じゃぁ、何で、そんなことまで含めるか分かりますか?
それは、ライバルを封じるためです。
特許請求の範囲に、「出力する」と書いてあるとします。
それじゃぁ、出力しないで、記録するだけの製品なら、その特許を回避できるわけです。
ほんで、別のシステムがそれを読みだすようにすれば、実質、同じような製品を作れるんです。
そんな抜け道を作らせないように、「出力」でなく「決定する」にするんです。
これが、特許の世界なんです。
だから、「特許請求の範囲」の一言一言って、ものすごく重要なんです。
次は、この行の最後の「人工知能システム」です。
じつは、ここ、審査で指摘されて補正した箇所なんです。
元々は「汎用人工知能システム」って書いてたんです。
狙いは、世界初の汎用人工知能で特許取得って言いたかったからです。
なんか、すごそうでしょ。
でも、これは難しいかなぁって思ってましたけど、やっぱり指摘されました。
なんで、そう思ったかって言うと、過去の出願を調べても「汎用人工知能」で出願したものが一件もなかったんです。
お役所なんで、前例がないものは嫌がるんですね。
審査官から、「汎用人工知能とは何を指すのか分からないからダメだ」って言われました。
それで、おとなしく「人工知能」に補正したんですよ。
でも、よく考えたら、人工知能ってのも、何を指すのか決まりはないんですけどね。
人工知能の特許はいっぱいあるってことだけで、この補正でOKがでたわけです。
ようやく、最初の1行の解説が終わりました。
この調子で解説してたら、いつ終わるか分からないので、こっからは、要点だけ説明しますね。
次に取り上げるのは、「人の動作および思考を再現可能な人オブジェクト」です。
これは、オブジェクト指向言語を想定しています。
オブジェクトなので、動きを表すメソッドと、属性を表すプロパティを持っています。
人オブジェクトの場合だと、歩くとか食べるってメソッドとか、氏名とか住所とかってプロパティを持ってるわけです。
ここで注意してほしいのは、、オブジェクトで表現するってことです。
今までのAIだと、たとえば文章を解析する場合、単語単位で解析するわけです。
「太郎」って単語が何回出現したかとか。
この「太郎」って、単に文字列、テキストデータの「太郎」でしかないわけです。
「太郎」は人間だとか、手足があって、歩いたり、走ったりするって情報は持ってません。
たとえ「人間」って単語と、「歩く」って単語とを関連付けていたとしても、「歩く」の意味を理解したことにはなりませんよね。
単に、単語と単語を結び付けてるだけで、意味を理解してることにはなってないんですよ。
それに対して、今回の特許では、太郎を人オブジェクトに変換したわけです。
人オブジェクトっていうのは、現実に存在する人に似た動きをするコンピュータプログラムです。
データの扱い方が、今までと全く違うわけです。
ここ、じつはAIの根本問題にかかわるとこなんです。
それが何かと言うと、シンボルグラウンディング問題です。
シンボルグラウンディング問題については、第27回「解決! シンボルグラウンディング問題」で説明してますけど、簡単に説明しときます。
たとえば、「人間が歩く」って言葉です。
「歩く」って言葉を、「二本の足を交互に動かして移動する」とかって言葉でいくら説明しても、説明したことにならないんですよ。
何でかっていうと、これって、説明じゃなくて、言葉を別の言葉で置き換えただけなんです。
言葉を言葉で置き換えてる限り、どこにも辿りつかないんです。
シンボルグラウンディング問題のことを記号接地問題とも言うんですけど、
要するに、言葉が現実世界に着地しないってことなんですよ。
さて、これを、今回の特許ではどうやって解決したかです。
まず、「人の動作を再現可能な人オブジェクト」を生成しました。
さらに、「人オブジェクトの動作が展開される3次元仮想世界」っていうのを用意しました。
3次元仮想世界は、たとえば、3Dの物理シミュレーターで作ります。
物理シミュレーターなので、空間とか、重力が再現されるので、人オブジェクトは、その中で足を交互に動かして歩くこともできるわけです。
これが歩くの意味です。
言葉で言葉を説明してるんじゃなくて、現実世界で人が歩くのと同じ状況をコンピュータで再現するんです。
そして、それに「歩く」って言葉を当てはめたんです。
こうやって、言葉が現実世界に着地したわけです。
シンボルグラウンディング問題も解決してるわけです。
この3次元仮想世界で意味を理解するっていうのは、ロボマインド・プロジェクトの「意識の仮想世界仮説」に相当するものです。
「意識の仮想世界仮説」に関しては、この本で詳しく説明しています。
説明欄にリンクを張っておくので、興味がある人は読んでください。
ようやく、特許請求の範囲の半分ぐらいまで説明しましたけど、まだ、肝心の部分が説明できてないですよね。
残りは、次回に説明したいと思います。
この動画が面白いと思った方は、ぜひ、チャンネル登録、高評価お願いしますね。
それでは、次回も、お楽しみに!