ロボマインド・プロジェクト、第615弾!
こんにちは、ロボマインドの田方です。
お久しぶりです。
前回から2ヵ月も開いてしまいました。
ロボマインド・チャンネルをはじめで5年以上経ちますけど、こんなに休んだのは初めてです。
理由は、新製品の開発に集中するためです。
ロボマインド・プロジェクトは僕がやりたいからやっているだけで、誰かに頼まれてやってるわけじゃないので、続けるにはお金を稼がないといけません。
今までは、昔作った製品で何とかやって来れたんですけど、それも限界に来たわけです。
ロボマインド・プロジェクトを思い立ったのは25年以上前です。
当時、特許事務所で働いていて、帰宅してからプログラムの勉強をしていました。
それじゃ、とても時間が足りないので、仕事を辞めて引きこもって研究していましたけど、数年でお金が尽きました。
それで、ビジネスを始めることにしました。
当時アマゾンが日本に上陸して、「せどり」というネットビジネスが生まれて、僕もせどりを始めました。
初めてすぐ、せどりツールを自分で作って、半年後にはそれを販売していました。
それが軌道に乗って安定してお金が入るようになるのに10年かかりました。
それで、ようやくロボマインド・プロジェクトを再開して、5年前からYouTubeを始めたわけです。
まぁ、やろうとしているのがAIに意識を発生させるとか、心を持たせるとか、スケールの大きいことなので、10年単位のプロジェクトになるのは仕方ないです。
ただ、今思い返すと、すべてつながっているように思います。
意識や心のモデルで海外特許も取りましたけど、これも、特許事務所で働いていたからです。
ビジネスを始めたとき、とにかく、お金さえ入れば何でもいいと思ってせどりを始めましたけど、これも関係あるんです。
というのも、今回開発した新製品は「せど楽AI」といって、せどりをするAIエージェントです。
じつは、せど楽AIを開発していて、今まで、どうしてもわからなかったことが分かったんです。
それが何かというと、シンギュラリティとは何かってことです。
シンギュラリティというのは、「AIの知能向上によって、社会が急激に変化する転換点」とかいわれます。
これだけだと抽象的すぎて、何がどう変わるのかわかりません。
実際、はっきりと答えられる人はいません。
それが、今回、かなり明確に分かったんですよ。
何がどう変わって、それによって、何が起こるのか。
これが今回のテーマです。
シンギュラリティの本当の意味。
それでは、始めましょう!
まずは、大きな枠組みとして、時代の流れを考えます。
時代の流れって、どんどん速くなっている気がしますよね。
たとえば、電気炊飯器が登場したのは1960年頃です。
その前はどうしてたかというと、かまどでご飯を炊いていました。
じゃぁ、かまどはいつ登場したかというと、なんと、平安、鎌倉時代です。
つまり、1000年ほど変わらなかった生活が、50年程前に突然、変わったんです。
つまり、時代の流れが速くなってきたのは、結構、最近のことなんです。
電気が暮らしを大きく変えたと言えそうです。
その変化は、さらに加速しています。
次は情報です。
30年前は、電話は一家に一台でした。
毎朝、新聞を読んで、家族で同じテレビを見ていました。
それが今は、一人一台スマホをもって、スマホでYouTubeを見ています。
たった30年で、すっかり変わってしまいましたよね。
これをグラフにしてみます。
横軸を時間、縦軸を技術進歩とすると、1000年ぐらい緩やかに上昇していたのが、この50年で、角度が急激に上がりました。
急上昇のきっかけは電気で、さらにコンピュータや通信技術でさらに加速しました。
いわゆる情報革命です。
さて、シンギュラリティは、ここからさらに急上昇するそうです。
さらに急上昇するって、うまくイメージできませんよね。
そこで、横軸を情報量にかえてみます。
情報量を横軸として、縦軸を暮らしの便利さとします。
情報量の増加というのは、情報を扱う機械の発明によって起こります。
500年ほど前に印刷機が発明されて、1940年代にコンピュータが登場して、1990年ごろからインターネットが普及して、2007年にiPhoneが発売されました。
その都度、人々が受け取る情報量が増えて便利になっていきます。
こう考えると、情報量の増加と暮らしの便利さは比例関係にあるといえますよね。
グラフにすると、緩やかな直線となります。
そして、シンギュラリティは、そこからさらに急上昇するわけです。
こう考えると、シンギュラリティの意味が変わります。
それは、情報量があたりの暮らしの便利さが変わるということです。
言い方を変えると、シンギュラリティとは、情報量が増えることじゃなくて、情報の質と密度が高くなると言えそうです。
これだけじゃ、まだピンとこないと思うので、今度は、情報の歴史から考えます。
人類最初の情報発明は言葉です。
そこから、文字を発明して、さらに印刷機、コンピュータ、インターネットと情報発明は続きます。
これらの発明によって、人が受け取る情報量が増加してきました。
情報量が爆発的に増加したきっかけはコンピュータです。
それまで、情報を処理するのは人間の脳でした。
ところが、コンピュータは、脳の外で情報処理をします。
長い情報の歴史において、ここで、情報処理が脳とコンピュータの二つに分かれたんです。
そして、コンピュータは量産できます。
お金をかければいくらでも処理を増やせます。
だから、爆発的に情報が増えたんです。
ただし、脳とコンピュータとでは、決定的な違いがあります。
脳が解釈するのは意味です。
一方、コンピュータが処理するのは、意味でなく、データです。
たとえばコンピュータにとって、犬の写真と、「イヌ」という文字は全く別のデータです。
一方は画像データで、一方はテキストデータです。
これが意味を理解しない情報処理です。
一方、脳は、意味でつなげます。
たとえば、ある人の脳からトム・クルーズに反応するニューロンが見つかりました。
そのニューロンは、トム・クルーズの写真を見たとき活性化します。
正面の顔写真でも横顔でも反応します。
それだけじゃなくて、「トム・クルーズ」という文字にも反応します。
画像データかテキストデータかは関係ありません。
重要なのは意味です。
これが脳の情報処理です。
さて、ここで、せどりを考えます。
電脳せどりというのは、複数のネットショップから、差額のある商品を探すという一種の情報処理です。
一見、コンピュータの得意な仕事に見えますけど、実は、そうじゃありません。
差額を計算するだけならコンピュータにもできます。
難しいのは、Aショップの商品と、Bショップの商品が同じかどうか判断することです。
なぜかというと、コンピュータにできるのは、同じデータかどうかだけです。
だから、JANコードが一致するとか、商品名が一致するとかって判断ならできます。
でも、同じ商品でも、アルファベットの「iPhone」とカタカナの「アイフォン」と、書き方が変わるだけで、もう、分かりません。
表現が変わっても、同じとわかるのが脳です。
これが、意味を使った情報処理です。
コンピュータが扱うのは、文字とか記号といった表面的なデータです。
そのデータが何を意味するのかは理解できません。
これが、脳とコンピュータの決定的な違いです。
そこに登場したのがLLM(大規模言語モデル)です。
LLMは、意味から考えて同じかどうか判断できます。
だから、アルファベットの「iPhone」とカタカナの「アイフォン」を同じと判断できます。
さらに画像も学習しているので、iPhoneの写真とiPhoneの文字が同じものを指すとわかります。
画像でも文字でも同じと判断できるって、トム・クルーズ細胞と同じですよね。
つまり、LLMは脳と同じように意味で情報を結びつけるんです。
つまり、情報処理の質や密度が変わったんです。
これによって、情報量が同じでも、急激な技術進歩が起こります。
これが、シンギュラリティです。
シンギュラリティの本質がわかりましたよね。
それは、情報のつながりが変わることです。
LLMは、いってみれば、脳が扱うデータをコンピュータが扱えるようにする仕組みです。
そして、コンピュータはインターネットに繋がります。
つまり、今まで脳でしか処理できなかったデータが、インターネットを介して世界につながるんです。
もっといえば、脳とインターネットが直接つながるってことです。
直接といっても物理的じゃないですよ。
物理的につなげるのは、脳に電極を埋め込むBMI技術です。
BMIがつなげるのはニューロンレベルです。
今起こっているのは、ニューロンの上のレイヤーです。
それは、意味レベルです。
意味レベルで脳とコンピュータがつながる世界です。
そりゃ、とんでもないことが起こります。
それは、インターネットに匹敵します。
時代の局面でいうと、今、僕らは、インターネットの登場と同じ場所にいるんですよ。
じゃぁ、それで、具体的に何が起こるんでしょ?
これが難しいんです。
インターネットが登場したときも、それで世の中がどう変わるか、だれも正確に予想できなかったですよね。
それを、今回、なんとか予想していきます。
まず、その一つが「せど楽AI」です。
「せど楽AI」がやったことは、人間しかできなかった商品の一致判定をコンピュータでしたことです。
もっといえば、人間の脳でしかつながらなかった二つの商品を、コンピュータでつなげることができるようになったんです。
そのおかげで、電脳せどりの仕入れ作業がコンピュータにできるようになったんです。
ただ、これはほんの一例です。
インターネットが出始めたころ、インターネット=ホームページでした。
それだけじゃ、何が便利か、よくわからなかったです。
そこに登場したのが検索エンジンです。
Googleがそれらをつなげたことで、一気に便利になりました。
重要なのは、データをつなげたことです。
しかも、Googleは、価値のある順にサイトを並べます。
これで、一気にインターネットが便利になりました。
そして、Googleが価値のあるサイトと判断するときに使ったのが被リンクです。
価値のあるサイトほど、多くのサイトからリンクを張られているということです。
YouTubeも同じです。
YouTubeは、再生回数、再生時間で動画の価値を測定します。
測定したいのは価値です。
価値というのはデータでなくて、意味ですよね。
でも、意味はコンピュータで扱えません。
そこで、なんとかコンピュータが扱えるデータで測定しようとて至ったのが、被リンク数とか再生回数です。
それで価値を推定するわけです。
これがアルゴリズムです。
だから、アルゴリズムが変わるだけで、アクセス数がガラッと変わります。
これが、意味を扱えない今までの情報処理の世界です。
それが、今後は、意味を使って直接、情報の価値を判断できるようになります。
そうなると、世界はガラッと変わります。
たとえば、価値は絶対的なものでなく、ある人にとっては価値があって、ある人にとっては価値がないということはよくあることですよね。
となると、誰にも同じ情報を提供するより、その人にあった情報を提供するのが正解です。
たとえば、商品を販売するページも、その人に会わせてリアルタイムで書き換えるとかです。
みんなと同じがいいと思っている人がいたとします。
その人には、「みんなこの商品を使っていますよ」と訴えかけます。
別の人は、人と違うのことこそ意味があると思っています。
その人には、「この商品は、まだ、誰も使っていませんよ」と訴えかけます。
その人の性格は、その人のSNSから読み取ります。
その人が、普段、どんなページを見ているかからその人の好みを判断します。
みんなと同じものを欲しがるか、だれも持っていないものを欲しがるか、アマゾンの購入履歴から判断するとかです。
それから、リアルタイムで翻訳する翻訳システムはすでにできつつあります。
それも、イヤホン型です。
それを、翻訳だけに使うのはもったいないです。
翻訳じゃなくて、相手の言っていることを、AIがその人に合わせて変換するんです。
難しい言葉を分かりやすく言い直したりとかです。
さらに、耳に痛い厳しい言葉は、その人を傷つけないように、やんわりと優しい言葉に言い換えたりします。
これが意味を理解するAIが生み出す世界です。
また、高精度なAIグラスは既にあります。
AIグラスを使えば、音だけじゃなく、その人に合わせた光景をAIが見せてくれます。
たとえば、女性の顔は、その人の好みに合わせてすべて補正します。
そうしたら、美女に囲まれて暮らせるわけです。
ねぇ、とんでもないことが起こるでしょ。
これがシンギュラリティです。
おそらく、数年後、世界は大きく変わっているでしょう。
変わるというか、大混乱の真っただ中にあるでしょう。
みんな、いったい、何が起こっているんだって思うでしょう。
そんな時、今日の話を思い出してほしいんです。
AIが直接意味を扱うようになったんだと。
脳とコンピュータが直接つながったんだと。
この視点を持っていれば、何が起こっているのか、正確に見通せるでしょう。
そして、シンギュラリティの最初の小さなプロダクト。
それが、「せど楽AI」です。
はい、今回はここまでです。
この動画がおもしろかったらチャンネル登録、高評価お願いしますね。
それから、よかったらこちらの本も読んでください。
それじゃぁ、次回も、おっ楽しみに!
第615回 シンギュラリティの本当の意