AIと脳の関係は双方向です。脳について理解することは、AIの作り方について多くのことを教えてくれます。一方で、AIについて理解することで、私たちの脳の仕組みが分かることもあります。ミミズから人間に至るまで、数十億年にわたる生命の進化を知ることで、その軌跡をAIの未来へと結びつけることができます。
~ ~ ~ ~ ~
はじめに
今回は、久しぶりに「これはすごい!面白い!」と思った本の紹介です。
いつも紹介している本が面白くないということではありません(汗)。特に面白かったという意味です。
紹介するのは、マックス・ベネット(Max Bennett, 1990 -)著の『A Brief History of Intelligence(邦題)知性の未来:脳はいかに進化し、AIは何を変えるのか』です。
タイミングよく日本語版も発売されましたが、いつものように私は英語版しか読んでいませんので、日本語版との表現の違い等についてはご了承ください。
~ ~ ~ ~ ~
脳科学とAIビジネス
この本は人間の先祖であるさまざまな生き物たちの「知性、知能(インテリジェンス)」の進化を、AIやテクノロジーの進化と対比しながら説明していきます。
この手の脳科学系の本には、うまく吸収できないところや、腑に落ちない部分がよくあったりしますが、ベネットが書くストーリーは斬新でありながら分かりやすく、筋道が通っています。頭の中で物事がロジカルに整理されている人の書き方をしています。
マックス・ベネットは、ニューヨークに拠点を置くeコマース企業向けのAI企業Albyの共同創業者兼CEOです。AIを活用して、顧客に商品に関するアドバイスを提供しています。それ以前は、AIを活用して大手ブランドのマーケティングを支援するBluecoreを2013年に共同創業し、CPO(最高製品責任者)を務めていました。
Bluecoreは最近時価評価額が10億ドルを超えた急成長中のAI企業で、2024年にAlbyを買収しています。
彼がすごいのは、I関連の起業家でもあると共に、進化脳科学志向の思想家で、研究者でもあることです。
まだ30代半ばでありながら、進化生物学や脳科学に深く鋭い見識を持ち、一方でAIビジネスにおいても成功を収めています。これらの複数のアイデンティティと絶え間ない好奇心が、彼にユニークな視点を与えているのでしょう。
物事の原理を探求しつつも、それゆえに実務者であり続けたいと願う私にとっては、まさに鏡のような存在です。
~ ~ ~ ~ ~
AIと脳は双方向
AIと脳の関係は双方向です。
脳について理解することは、人工知能(AI)の作り方について多くのことを教えてくれます。
人間の脳がどのようにして現在の姿になったかを理解することで、AIの未だ不十分な点、そしてギャップを埋めるために何が必要なのかを知ることができます。
一方で、AIについて理解することで、私たちの脳の仕組みが分かることもあります。
例えば、私たちの脳のある機能が、特定のアルゴリズムを使用していると考えられているとします。しかし、それをAIに実装しても機能しない場合があります。それは、私たちの脳の理解が間違っていることを示しているのかもしれません。逆に、AIで機能するアルゴリズムが見つかり、そのことで、私たちの脳も同じようなアルゴリズムで動いている可能性があると知ることがあります。
ベネットは、過去をさかのぼり、人類の先祖たちのインテリジェンスがどのように進化したかを理解することが、人工知能の構築に役立つと主張します。そして、ミミズから人間に至るまで、数十億年にわたる進化の壮大な物語を描き出し、その軌跡をAIの未来へと結びつけています。
この本は、脳科学に関心を持つ人と、AIの未来に関心を持つ人、そして両者の交差点に興味を持つ人たちに多くの洞察を与える本でしょう。
~ ~ ~ ~ ~
5つのブレイクスルー
ベネットはインテリジェンスは人間に限られたものではないと言います。すべての生き物がそれぞれのインテリジェンスを持っています。
本書を手に取る方は、どうしてもAIについて記述されている箇所に意識が向いてしまうかもしれません。しかし、この本が素晴らしいのは、むしろ、人間に至るまでの生き物たちの知性の進化をストーリーとしてまとめている点です。そして、それを5つの重要な進化のブレークスルーに紐づけて説明している点です。
その5つのブレークスルーを紹介しましょう。
~ ~ ~ ~ ~
ブレークスルーが起きる前:放射状対称動物
まず、人間の進化の起源まで歴史をさかのぼりましょう。
その原点と言えるのが、初期の放射状対称動物(radially symmetrical animals)です。具体的には、今のクラゲ、イソギンチャク、サンゴなどのような、中心軸に対して対称な動物です。
これらの生き物には、その後進化した生き物が持つような、まとまった脳はなく、体全体に神経網(ニューロン)が広がっていました。
単細胞生物ではニューロンは不要でしたが、これらの多細胞生物は、刺激を筋肉への指令に変えるためにニューロンが必要でした。この太古の祖先が獲得したニューロンの形態は、私たちの今の脳のニューロンと基本的に変わりません。進化によって変わったのは、その配線です。脳の基本要素は、6億年以上もの間、同じままなのです。
放射状対称動物の行動は反射的です。つまり、積極的に狩りをしたり、獲物に向かって移動したりしません。ずっと獲物を待ち伏せたり、水流に任せて漂ったりするだけで、触手に近づいてきた獲物を反射的に捕獲します。
集中した脳はありませんが、ある意味での知性(インテリジェンス)を持ち合わせています。
化学物質を感知したり、触覚に反応したり、光を検知したり、筋肉を収縮させたり、内部状態(空腹、満腹、脅威)に基づいて行動を調整することができます。
私たちは、このような初期の生物を原始的で低レベルな生き物と考えがちですが、知性は様々なレベルで発現するという違いがあるだけです。
知性が「それぞれが置かれた環境に適応する能力」であるならば、放射状対称動物の、分散型、反射型、感覚運動型の知性は、その環境においては、間違いなくその条件を満たしているのです。
彼らの世界は、ゆっくりと漂う獲物で満ち溢れ、海流に支配されています。そのような環境では、単純な反応型知能がエネルギー効率が高く、必要なのはごくわずかな刺激に反応して高速で獲物を捕らえるシステムだけであり、彼らはそれを完璧に実現しているのです。

~ ~ ~ ~ ~
第1のブレークスルー:操縦(Steering)初期の左右相称動物
6億年前ごろに現れ始めた左右相称動物(bilaterian)は、放射状対称動物にはなかった「獲物を積極的に捕らえるために自ら移動する能力」をもつ生き物です。狩りを行うために新しいレベルの知能を手に入れました。
左右相称動物はその名が示すとおり、体がほぼ左右対称で、前面(顔、口)と背面(排泄)があります。獲物や安全な場所など「良いもの」に向かって前に進み、「悪いもの」から遠ざかる判断ができるます。
入力された様々な感覚を統合処理し、行動の決定を下すための領域である「脳」(ニューロンの集合体)を持ち始めたのも左右相称動物です。つまり、左右相称動物は初の集中知能型の生き物です。
最古の左右相称動物として、単純なミミズや線虫のような生き物が挙げられます。人間も左右相称動物です。
左右相称なのは、自分の身体を操縦する上で効果的だからです。四方八方から近寄ってくる餌をじっと待つだけであれば、放射状対称が合理的です。しかし、餌に向かうために前進したり、旋回したり、餌を見定めて捕らえるためには、左右対称かつ前後がある体の方が合理的です。
加えて、左右相称動物は、基本的な神経伝達物質やホルモンも持つようになりました。
例えば、餌に向かって移動するシグナルを送るために、欲求や期待を引き起こすドーパミンが生まれました。獲物にありついた後は、セロトニンが消化を促し、満足感をもたらします。
移動中に危険を察知したときは、アドレナリンが警戒のシグナルを発し、逃走のために覚醒します。そして、オピオイドが、覚醒を静める働きをします。
人間の発明例で言えば、左右相称動物は初期のルンバ(ロボット掃除機)と驚くほど似通っています。
どちらも左右対称で前と後ろがあります。
どちらもとてもシンプルなセンサーで限られた情報だけを感知します。ルンバは、バンパーが壁にぶつかったり赤外線信号に反応して方向転換します。これは、左右相称動物が持つ単純な刺激反応ループと同じです。何かを予測したり最適化するわけではなく、ただ反応するだけです。
バッテリーが切れそうになると、充電ステーションからのセンサーを頼りにその方向に向かいます。内部状態の変化が行動に影響するのも左右相称動物と同じです。
部屋を掃除するという目的に対しては、このルンバのシンプルな機能で十分なのです。複雑な機能は必要ありません。現代のミミズや線虫などの左右相称動物も同じです。複雑になるほど多くのエネルギーが必要になってしまいます。その環境下で生きるためには、シンプルな機能で十分なのです。

~ ~ ~ ~ ~
第2のブレークスルー:強化学習(reinforcement learning)初期の脊椎動物
第1のブレークスルーを成し遂げた左右相称動物は「良いもの」に向かって進み、「悪いもの」から遠ざかる能力を身に付けた生き物でした。しかし、これには課題点もあります。
世の中には「良いか悪いか」が簡単に分からない場合もあるからです。時間が経たないと分からなかったり、さまざまなステップを進めていって初めて良いか悪いか分かったりすることがあります。例えば、迷路では右と左、どちらがゴールにつながっているかは行ってみないと分かりません。
その課題に対する能力を身に付け、第2のブレークスルーを達成したのは、5億年前くらいに現れた魚類の祖先である初期の脊椎動物(vertebrate)です。
脊椎動物は、脳がより構造化され、階層化され、多くのサブユニットが発達し、単純に餌を追いかけるだけでなく、複雑な課題に柔軟に対応できるようになります。
具体的には、トライアンドエラーで改善していく、つまり行動のフィードバックに基づいて適応する学習能力を身に付けるようになり、強化学習によって、良い結果につながる行動を繰り返し、悪い結果につながる行動を抑制することを覚えました。
また、餌に対して動機づけられるだけでなく(外発的動機)、次に何が起きるんだろうとか、とにかく行ってみよう!という好奇心に対しても動機づけられるようになりました(内発的動機)。好奇心は魚やネズミ、人間まですべての脊椎動物で見られる機能です。
学習自体が喜びであり、動機付けになるのです。好奇心を持って、さまざまなパターンを認識したり、多くの場所を覚えることで、生存確率が上がるからです。様々な探索ができるように、パターンや空間の認識能力、タイミングを計る能力も向上しました。このころの脳は、既に私たち人間の脳の初期的な形に進化しています。
AIもこの段階の生物が身に付けた機能を利用しています。良い結果に対する報酬に基づく強化学習です。
ただし、行動が良い結果に結び付いているかどうかを判断するのは難しい場合もあります。例えば、チェスや将棋などの複雑なゲームでは、勝敗が決定した直前の一手ではなく、何十手も前の一手が勝敗を決めることがあります。また、最終的に勝利したとしても、試合中に勝利から遠ざかる「悪い手」を幾度か打ってしまったかもしれません。
このような結果が良かった(または悪かった)とき、どの行動がその結果を引き起こしたのかを判断するのが難しい問題を、報酬分配問題(Credit Assignment Problem)と言いますが、AIに使われている時間差分学習(Temporal difference learning, TD learing)は、前の予測と次の予測との差によって学ぶ方法で、直接的な報酬ではなく、予測値の変化で価値を更新しているのです。

~ ~ ~ ~ ~
第3のブレークスルー:シミュレーション(Simulation)初期の哺乳類
今のネズミやリスのような姿の初期の哺乳類が現れたのは、約2億年前です。巨大な恐竜や翼竜が支配する世界で、体は小さく、昼間は穴に隠れて、比較的安全な夜に穴から抜け出して活動していました。
進化に伴い、初期の哺乳類には新しい脳構造として大脳新皮質(neocortex)が出現しました。
これによって、「反応→行動」だけでなく、「思考→行動」も可能になりました。具体的に大脳新皮質が可能にしたのは、実際に物事が起きる前に頭の中でシミュレーションできる能力、つまり「頭の中で試行錯誤を行う」能力です。
過去の出来事を思い出し(エピソード記憶)、選択肢によって起こりうる未来を想像し、もしもの場合を想定して推論し(反事実学習)、それらを比較して最適なものを選び、それに応じて計画を立てることができました。
つまり、初期の脊椎動物が「実際に試してみる」ことで学習する能力を備えたのに対して、初期の哺乳類は「実際に試す前に」起きることを想像して、複雑な行動を頭の中でシミュレーションして次の行動を決める能力を手にしたのです。
これは、柔軟性と先見性において、脊椎動物が成し遂げた試行錯誤をはるかに超える大きな飛躍でした。これが第3のブレークスルーになります。
初期の哺乳類以降の生き物は、すべての入力感覚をシミュレーションします。外部から感覚が入力される前に、内部のシミュレートされた現実を最適化します。
必ずしも外部からのインプットに合わせて行動しているわけではなく、自分の中の「世界モデル」に基づいて行動していて、実際に経験したことを知覚するのではなく、経験から推論されたシミュレートされた現実を知覚しているのです。
私たち人間も、自分たちが気が付かないほどの膨大な事前予測を立て、それに従って行動しています。
例えば、複雑な意思決定のみだけでなく、「階段を下りる」といった動作でさえ、階段を見てから次の足の動きを決めるのではなく、事前にシミュレーションして、実行中にフィードバックを受けて微調整しているのです。
みなさんには一段だけ高さが違う階段で足を踏み外しそうになった経験があるでしょう。それは、事前予測(feedforward)が実際と異なり、実行中のフィードバック(feedback)で修正しきれなかったためです。
人間の発明例で言えば、2016年に誕生した AlphaGoは、深層学習(ディープラーニング)とモンテカルロシミュレーションを組み合わせたもので、哺乳類の脳の進化に相当します。
車の自動運転もこの段階の進化にあたります。周りの車・歩行者の動きを先読みし、どの道を進むべきか、事前に大量のシナリオを学習した上で、実行時にシミュレーションを高速で並列実行し、どう動くべきかを決めています。
~ ~ ~ ~ ~
第4のブレークスルー:自分や他人の心理を知る力(mentalizing)初期の霊長類
1千億年前、初期の霊長類は、果食動物で、木の上で果実を採るという食生活を送っていて、熟した果実が地面に落ちる前に摘み取って食べていました。
この能力によって、霊長類は他の動物とほとんど競争することなく、容易に食料を得ることができました。
この生態的優位性が、彼らに2つの恩恵をもたらします。
1つ目は豊富なカロリーを摂り、多くのエネルギーを利用することができたことで、2つ目は、自由な時間がたくさんできたことです。
動物界において自由時間は稀です。ほとんどの動物は、日々のあらゆる瞬間を生きることに費やします。しかし、これらの果食性の霊長類は、他の動物ほど多くの時間を餌探しに費やす必要がなかったので、時間に余裕ができたのです。
霊長類は、その余裕時間を、グループ内の政治活動や社交活動、つまり、自分の地位向上やネットワーキング、仲間の行動の観察や駆け引きの時間に利用しました。つまり、筋肉を鍛えることにエネルギーを費やす代わりに、脳をより進化させることにエネルギーを費やしたのです。
実際、今日の霊長類は、1日最大20%を社交に費やしていて、これは他の哺乳類よりもはるかに長い時間です。
初期の霊長類には、次の3つの能力が出現したと考えられます。
心の理論(theory of mind):他者の意図や知識を推測する
模倣学習(imitation learing):他者を観察することで新しいスキルを身に付ける
将来の予測(anticipate future needs):今は欲しくなくても、将来のニーズのために今行動を起こす
実は、これらは別々の独立した能力ではなく、むしろ新たな第4のブレークスルーである「メンタライジング」から生まれた相互に関係する能力です。「メンタライジング」とは、世界をモデル化するだけでなく、自分の心、他人の心もモデル化できる能力で、自分や他人の信念、意図、知識を推測し、行動を予測できます。
これにより、他者の目標理解、社会的推論、将来のニーズ予測、そして社会学習によるスキルの伝承が可能になりました。
このことは、これらの能力が、初期霊長類で最初に進化した共通の脳領域(例えばgPFC)から出現しているという事実からも明らかです。この新しい領域は、自分や他人の心について推論する能力が発現する領域です。
これらの新しい霊長類の領域は、他者の心を模倣するだけでなく、想像上の未来に自分を投影すること、鏡に映った自分を認識すること(ミラーサイン症候群)、そして自分の動きを認識すること(エイリアンハンド症候群)にも必要です。
メンタライズ能力、つまり心の理論、模倣学習、そして将来の予測能力がしめすことは、社会脳と生態脳はコインの表裏一体だということです。つまり、脳の進化は、木の上で果物をうまく採集するスキルを習得する能力と、自分の心や他人の心をモデル化して、他人を観察し、政治をうまく行う能力の両方を同時に解き放ったのです。
進化の結果、今から7千年前には重さ0.5グラム以下だった私たちの先祖の脳は、霊長類では脳領域(特に前頭前皮質)が拡大し、1千年前には350グラムになるまで拡大しました。約1,000倍にもなったのです。
なお、現在のAIはこの第4のブレークスルーまでは到達していません。
一見、私たちの心を読んでいるように見えることがあるかもしれませんが、それは、言語パターンから推測した出力に過ぎず、心の表象を内部に持っていることを意味するものではありません。
~ ~ ~ ~ ~
第5のブレークスルー:話すこと(speaking)初期の人類
最後のブレークスルーは、初期の人類が手に入れた「話す」能力です。
言語を進化させたことで、私たちは内なるシミュレーションを情報として共有し、特定の集団や世代を超えて蓄積できるようになりました。
ではAIについてはどうでしょうか?
AIは言語能力を身に付けているように見えますが、実際には、人間が生物学的に持つような言語能力はありません。
AIが持っているのは、言語操作能力(抽象・統計・推論)です。両者は本質的にまったく異なるシステムです。
人間の言語能力は、脳の進化に深く根ざした生物的モジュールですが、現在のAI(GPTなど)の言語能力は、言語パターンを予測して話すシステムです。しかし、その点においては、AIはすでに人間に匹敵、あるいは上回る進化を遂げています。人間よりもはるかに膨大な情報を蓄積できる能力と、高速で処理する能力があるからです。
~ ~ ~ ~ ~
さいごに:第6のブレークスルー
さて、最後にもう一度おさらいしましょう。ベネットは本の中で、人類とそれ以前の生命の知性の発展を、以下の5段階のブレークスルーによって説明しました。
第1のブレークスルー:操縦(Steering)。初期の左右相称動物
~「向かう・避ける」という基礎的な意思決定を獲得
第2のブレークスルー:強化学習(reinforcement learning)。初期の脊椎動物
~ 報酬と罰による試行錯誤学習 (強化学習) の登場
第3のブレークスルー:シミュレーション(Simulation)。初期の哺乳類
~ 環境や未来を、脳の中でモデル化(予測)し、再現する能力
第4のブレークスルー:自分や他人の心理を知る力(mentalizing)。初期の霊長類
~ 他者の意図や心を推測する能力、社会的知性の登場
第5のブレークスルー:話すこと(speaking)。初期の人類
~ 言語や記号を用いた抽象的・複雑なコミュニケーション、思考の獲得
これらのブレークスルーによって、私たちは、単純な刺激応答から、複雑な認知、社会性、言語性を獲得しました。
そして、ベネットは、私たちは現在「第6のブレークスルー」の直前にいると言います。
第 6 のブレークスルーでは、知能は生物から切り離されます。つまり、人工知能の進化です。
生物としての脳や身体に依存しない知性の外部化が進みます。つまり、ハードウェア化 / ソフトウェア化された「外部脳」を誰もが持つようになります。そのスピードと処理能力は、人間のニューロンの処理スピードや人間が利用できるエネルギー量とは比べ物になりません。
AIは単なる道具ではなく、人間の知性を拡張し、共有するものになります。これまで人間に限定されていた能力を、機械と共に拡大し深化させます。私たちは生物学的限界を超えるのです。
ベネットは、第6のブレークスルーについて詳細には述べておらず、また、あくまでも予見であり仮説だと言いますが、実際に知性の外部化はすでに起きています。
以前書いた記事『書き換え続けられる脳 ライブワイヤード Livewired』の中で紹介した、アメリカの著名な脳科学者デイヴィッド・イーグルマンが「ポテトヘッドモデル(Potato head model)」という言葉を使って表現したように、私たちの脳は外部の新しいタイプの入力情報を処理でき、外部から付け加えられた機能を利用することができるようになっています。
ジャガイモにさまざまなものを突き刺せるように、人間にも新しい機能を外部から付け加えることで、脳はそれをあたかも自分自身の体の一部であるかのように新しい感覚を使いこなせるようになるのです。
パソコンやスマホでAIを利用するどころか、身体に装着したり、パソコンをメモリー増設するように体内に何かを埋め込んで、処理能力を拡大することすらできるようになってしまうかもしれません。
しかし、それは私たちに本当に良い未来をもたらすのでしょうか?

そのような将来に起きると予想されることだけではなく、私たちの身の回りで実際にすでに起きていることだけでも、私たちが今思っているよりも大きなインパクトをすでにもたらしているかもしれません。
今の子どもたちは、スマホが日常であるだけでなく、機械が何でも質問に答えてくれる時代、機械が悩みを聞いてくれ、相談に乗ってくれる時代にすでに生まれてきています。
AIがまだない時代を知らない世代、機械が助けてくれない生活経験がない世代になるのです。
「自分の脳とAIが一体の思考システムとして働く時代の到来」とは聞こえがよいですが、私は、スマホでさえ、子どもたちの心身の成長に大きな影響を与えていることが認識されるようになってきている今、AIが私たちの子供たちの身体や心や生活や未来に、いったいどのような影響をもたらすのだろうかということが、どうしても気になって仕方ないのです。