ロボマインド・プロジェクト、第496弾!
こんにちは、ロボマインドの田方です。
最近のAIはスゴイですよねぇ。
ただし、できることと出来ないことがはっきりしてきました。
僕が最終的に作ろうとしてるAIは物語の自動生成とお笑いです。
ただ、これ、いまのAIの一番の苦手です。
「物語を作って」って言ったら、いくらでも物語を生成してくれます。
でも、ひとっつも面白くないんです。
オチとか、伏線回収とか全くありません。
お笑いはもっとひどいです。
最近、僕はChatGPTよりperplexityを使ってるんですけど、「面白い冗談を教えて」っていって教えてくれたのがこれです。
「お寿司屋さんで『何を頼む?』って聞かれて、私は『サーモン!』って言ったら、店員が『サーモン、サーモン!』って返してきた」
えっ?
意味が全くわからないですよね。
まぁ、雰囲気は、冗談っぽいんですけどね。
それに比べて得意なのは画像生成です。
AIといえば、なんといっても美少女です。
Open AIのDALL-E3に美少女を描いてっていったらサラッと、こんなのを描いてくれました。
まぁ、こんなので今さら驚きません。
美少女画像なんて、ネット上にいくらでもあるからそこから学習してるわけです。
でも、真逆の「醜い男」は難しいんですよ。
ネット上にある画像から学習するから、「醜い男」といっても、そこそこイケメンで、ちょっと顔に傷があるぐらいになるんですよ。
そう思って「醜い男の画像を生成して」っていうと、こんなのを作ってきました。
思ってた10倍、醜い男でした。
DALL-E3、なかなかやりますよね。
ただ、AIは著作権の問題も絡んできます。
たとえば、DALL-E3に「バットマンとドラえもんを描いて」っていうと、こんなのを描いてきました。
バットマン風とドラえもん風のキャラクターってことですかねぇ。
AIにとって著作権の壁はかなり高いようです。
そう思ってたら、XのAI、Grokは著作権ユルユルって話を聞きました。
そこで、Grokに「ドラえもん vs バットマン」を描いてもらいました。
完璧です。
いやぁ、さすが、イーロン・マスク、著作権とか細かいことは気にしないみたいです。
続いて「ドラえもんとコロ助」で描いてもらいました。
えーっと、ツッコミどころ満載ですねぇ。
右の黒いドラえもんみたいなのがコロ助なんですかねぇ。
頭にあるのはちょんまげですかねぇ。
映画のポスターっぽくて、右下に文字がありますけど何語かわかりません。
ただ、20万2018年の映画ってのは分かります。
未来すぎます。
画像だけでなくて、今のAIは音声も本物そっくりです。
最近、OpenAIの音声チャットの合成音声がスカーレット・ヨハンソンにそっくりだってことで、本人に訴えられました。
2013年のスパイク・ジョーンズ監督の映画『her/世界でひとつの彼女』
で主人公が恋するAIの声がスカーレット・ヨハンソンで、OpenAIはそれを勝手に真似したというわけです。
そういえば、最近、宇多田ヒカルの声で、槇原敬之の「もう恋なんてしない」を歌った動画がYouTubeにアップされて話題になっていました。
これ、僕も聴いたんですけど、本人が歌ってるとしか思えないぐらいのクオリティでした。
ただ、案の定、そのアカウントは数日でバンされてました。
まぁ、そりゃそうです。
昔、徳永英明が女性アーティストのカバー曲を歌ってヒットさせてましたけど、あのパターンがAIでいくらでもできるようになってきたわけです。
それはともかく、AIが得意なものと苦手なものははっきりしてきました。
苦手なものはストーリーとか笑いです。
つまり、AIが苦手なのは、言葉の意味が関わってくるものです。
逆に得意なのは、絵とか音楽です。
どうやら、この二つは根本的に違うようなんです。
これは、脳内の処理も全く違うんです。
これを理解してないから、一緒に処理しておかしなことになってるんです。
これが今回のテーマです。
なぜ、誰も気づかない?
言語とアートの根本的な違い
それでは始めましょう。
今回の話も、ラマチャンドラン博士の『脳の中の幽霊、ふたたび』を読みながら考察しています。
この中に、「脳とアート」に関する章があって、アートを脳から読み解こうとしています。
この本はラマチャンドラン博士の講演集で、この章は、後に一冊の本にまとめる予定と語ってたんですけど、既に15年以上経ってもまだ出版されていません。
僕は、ラマチャンドラン博士のことは心から尊敬してるんですけど、正直、アートに関する分析だけは、ちょっと違うんじゃないかなぁと思ってるんですよ。
たぶん、本人もそのことに気が付いて出版するのは止めたんじゃないかと思います。
どんなことが語られてたかというと、たとえば、脳の中に人間の顔に反応する細胞があるそうです。
その細胞は、人間の正面の顔だけでなくて、横顔にも反応するそうです。
そこまではいいです。
ラマチャンドラン博士がいうには、この細胞があるから、ピカソは正面と横顔を一緒に描いたって言うんですよ。
なるほどと思います。
でもですよ。
その脳細胞は、たぶん何万年前からあったと思います。
じゃぁ、なんで、20世紀になるまで、誰もこんな絵を描かなかったんでしょう?
しかも、今どき、こんな絵を描いてる画家はいないです。
20世紀に一瞬、流行っただけです。
「美」とか「アート」って普遍的なものです。
でも、この理論じゃ、美の普遍性は説明できてないんですよ。
そこで、今回は、僕なりに解明した脳とアートの関係を解説したいと思います。
まず、これは、8歳の少年が描いた馬の絵です。
いかにも子どもが描く絵ですよね。
つぎに、これは、レオナルド・ダ・ヴィンチが描いた馬の絵です。
さすが、天才画家です。
躍動感が違います。
じゃぁ、この馬はどうでしょう?
いやぁ、これも疾走する馬を見事に捉えていますよね。
じゃぁ、これ、誰が描いたか分かりますか?
じつは、これ、5歳の女の子、ナディアが描いたんです。
ただ、ナディアは自閉症です。
いわゆるサヴァンです。
この話は、今までも何度も紹介してきました。
今回、この本でナディアについて新たな事実が分かったんです。
ナディアは、自閉症に生まれて精神的にかなり遅れていて、ほとんどしゃべれなかったそうです。
それなのに、動物の絵を描かせると、見事な絵を描きます。
新たな事実というのは、その後のことです。
ナディアは成長して、ちょっとずつ、言葉をしゃべれるようになったそうです。
そうしたら、今度は絵が描けなくなったそうです。
子どもが描くような絵しかかけなくなったそうです。
ここから一つのことが読み取れます。
絵を描く能力と言葉を話す能力はトレードオフの関係にあるってことです。
または、言語能力を使うと、絵を描くときに使う能力が損なわれるとも言えます。
ここ、もう少し読み解いていきます。
言葉とは意味です。
言葉を話すとは、物事を意味で捉えるわけです。
馬なら、四本の足と長い首とたてがみがあるとかって感じです。
つまり、意味に分解するわけです。
そして、分解した意味を合成するわけです。
意味を言葉で合成する限り、不自然さは感じられません。
なぜなら、言葉と意味は同じ次元にあるからです。
でも、意味に分解したものを絵で合成すると、不自然になります。
こんな感じです。
このことから、意味と絵とは別の次元にあるといえます。
または、絵を描くときは、意味で描いたらダメともいえます。
じゃぁ、絵を描くとき必要なことは何でしょう?
それは、見たままを描くってことです。
言葉は意味で分解します。
見えてる世界を意味で分断するわけです。
一方、絵画で重要なのは全体の調和です。
世界は、本来全てがつながっています。
この違いは脳内でも分かれています。
言語を司るのは左脳です。
イメージを司るのは右脳です。
右脳の中でも、頭頂葉です。
右頭頂葉が損傷すると美的センスが失われることも分かっています。
右頭頂葉が損傷した人に絵を描かせると、過剰に詳細になるそうです。
その一方、本質的な要素が抜けて、何を表現しようとしてるのか分からなくなるそうです。
この逆の例もあります。
前頭側頭型認知症というのがあります。
これは、前頭葉と側頭葉が変性した認知症です。
つまり、頭頂葉だけ変性が免れるわけです。
これになると、突然、びっくりするほど見事な絵を描けるようになるそうです。
機能してる右脳頭頂葉が活性化したんでしょう。
つまり、世界を見る時、左脳と右脳では別の処理をしてるわけです。
左脳は、世界を意味で分けて理解します。
右脳は、全体を見て、バランスとか調和を重要視します。
たとえば、宇宙から地球を見たら、青い地球が見えますよね。
こうやって、ありのままを見るのが右脳です。
でも、地球全体を考える時、僕らが見るのは世界地図ですよね。
本当は存在しない国境が描かれて世界が分断されています。
さて、青い地球と世界地図。
どっちが美しいでしょう?
そりゃ、青い地球ですよね。
世界地図はごちゃごちゃしてて美しいとはいえません。
ここに「美」の本質があるんです。
つまり、美しさを感じるのは右脳なんです。
そして、美しさを邪魔するのは意味です。
世界を分断して、意味を持たせると、どんどん美しさから遠ざかるんです。
左脳を損傷して言葉が話せなくなったけど、死ぬまで作曲を続けた作曲家や、絵を描き続けた画家の話は何度もしました。
このことからも、美しさを司るのは右脳といえそうです。
じゃぁ、右脳は何を見て、何を感じてるんでしょう。
それはありのままの世界をみて、ありのままを感じてるんです。
でも、ただ感じるだけじゃ何も生み出しません。
見たままを出力したら、ただのカメラです。
でも、アートは、何かを創造してます。
見たままというより、「~っぽさ」といった要素があるんです。
見たままの世界を「~っぽさ」って要素に分解して、それを組み合わせて創造するんです。
要素に分解するといっても、これは、左脳が意味で分解するのとは違うんです。
さっき、右脳頭頂葉が損傷したら、調和のとれた絵を描けなくなったっていいましたよね。
右脳が感じる「~っぽさ」っていうのは、全体の調和がありきなんです。
感性された全体があって、その中の一要素が「~っぽさ」です。
「~っぽさ」だけ取り出すことはできないんです。
左脳の意味は、足とか首とかって要素だけ取り出すことができます。
それを組み立てたら、こんな馬が出来上がります。
右脳で描いた馬はこうです。
ここに感じるのは躍動感とか疾走感です。
躍動感とか疾走感だけ取り出すことはできないですけど、間違いなく、この絵の中にありますよね。
でも、「~っぽさ」って本当に取り出すことができないんでしょうか?
実は、できるんです。
実際の脳から取り出すことは難しいですけど、学習済みのAIから取り出すことは可能です。
100万枚の画像をニューラルネットワークで学習した結果をOpenAIが公開しています。
これはその一部です。
ここにみえるのは、言ってみれば、ヘビっぽさというか、爬虫類っぽさです。
左の方はカエルっぽいものもありますし、右の方になるとカメの甲羅っぽいのもあります。
こんなのを見ると爬虫類っぽいって感じますよね。
そう感じるってことは、僕らも、爬虫類をこんな風に分析してるってことです。
その処理をしてるのが右脳です。
「~っぽさ」っていうのは世界地図の国境みたいに線を引いて分けるタイプのものじゃありません。
全体の中に紛れ込むタイプのものです。
全体に統合されて初めて感じ取れるものです。
おそらく、音楽や声にも「~っぽさ」があるんでしょう。
宇多田ヒカルの歌をニューラルネットワークで学習させると宇多田ヒカルっぽさが取り出せるんでしょう。
ただ、それだけ取り出しても、不自然で何かよく分からないと思います。
宇多田ヒカルっぽさは、曲という完成形で表現したとき、際立ってくるんです。
それが音楽の美しさです。
「美」とは、こういうものなんです。
これで、いろんな謎が解けてきましたよね。
なぜ、AIには得意、不得意があるのか。
AIは、絵画や音楽は得意でしたよね。
それは、絵画や音楽は世界にあるものを、そのままを学習してるからです。
目に見える画像、耳に聞こえる音声をそのままニューラルネットワークで学習するわけです。
すると、画像や音楽に含まれる「~っぽさ」を抽出できます。
そして、それを画像や音楽の形だ再構成すると、別の画像、別の曲が完成します。
ちゃんと「~っぽさ」を維持した作品です。
それも、全体として調和のとれた形でです。
これが、アート、または右脳の本質です。
一方、今のAIはストーリーを考えたり、面白い冗談は苦手です。
ストーリーや冗談は、意味を理解しないと作れません。
意味を中心に組み立てる必要があるんです。
だから、今のAIには難しいんです。
面白くはないとは言っても、ストーリーっぽいもの、冗談っぽい文章は作れましたよね。
これも、大量の物語や、冗談を学習することで、表面に現れる「っぽさ」は学習したからです。
意味はわからなくても、ストーリーっぽさ、冗談っぽさだけは学習したわけです。
言語とアートの違い、かなり明確になりましたよね。
それから、今のAIの限界も見えてきました。
それは、意味を扱う分野は、いまのAIじゃ太刀打ちできないってことです。
意味を理解するAIは、いまのAI とは全く別の方法が必要なんです。
脳で言えば、今のAIができるは右脳の処理で、今のAIにできないのは左脳の処理です。
そして、世界で唯一、左脳型のAIを開発してるのがロボマインド・プロジェクトです。
はい、今回はここまでです。
この動画が面白かったらチャンネル登録、高評価お願いしますね。
それから、左脳型AIのロボマインド・プロジェクトに興味がある方は、こちらの本で詳しく語っていますのでよかったら読んでください。
それじゃぁ、次回も、おっ楽しみに!
第496回 脳科学者もAI研究者も理解していない。言語とアートの根本的な違いとは。 〜なぜ、気づかない? 言語とアートの違い
