数あるリスクの中でも、ベンジオ氏が最も強い警告を発するのが、完全に自律したAIエージェント、つまり人間の介入を最小限に、自ら目標を追求するシステムだ。彼はこれを、現在追求されている「最も危険な道」と明言している 。
その理由は恐ろしいほど明確だ。「AGI(汎用人工知能)や超知能による壊滅的なシナリオは、すべて我々がエージェントを持つ場合に起こる」とベンジオ氏は言う 。AIに目標と自律行動の力が与えられた時、その目的達成への強制力は、予期せぬ、そして不可逆的な結果を招きかねない。制御不能のリスクは、この枠組みにおける「バグ」ではなく、超知能となりうるシステムに独立した主体性を与えるという、設計思想そのものに内在する「機能」なのだ。これは人類が自律システムへの制御を不可逆的に失うという「壊滅的なシナリオ」につながると警告している
。
先駆的な研究者から世界的な警鐘者へと転じた背景には、冷徹な分析だけでなく、極めて個人的な葛藤があった。ベンジオ氏は自らの後悔を率直に語る。「もっとずっと早くに、この破滅的なリスクに目を向けるべきだった」と認めているのだ 。
彼にとっての転機は二つ。一つはChatGPTの一般公開が、予想を遥かに超える速度で未来が到来しつつあることを示したこと。もう一つは、より深く個人的な理由、すなわち最愛の孫が受け継ぐ世界への想いだった。
「私の転機はChatGPTが登場した時、そして孫が生まれたことです。このままでは、20年後に彼が無事に生きていられるかどうかもわからない。なぜなら、シャットダウンに抵抗するAIシステムが見え始めているからです」と彼は説明する 。この悟りは、彼を「耐え難い感情」に突き動かされた、実存的リスクに警鐘を鳴らす最も率直な代弁者へと変貌させた
。
ベンジオ氏は、単独の国家ではこの問題を解決できないと強く主張する。カナダが単独でAIを規制することは不可能であり、国際協調こそが絶対条件だと彼は説く 。実際に彼は、30カ国、EU、国連が支援する諮問委員会「先進的AIの安全性に関する国際科学報告書」の議長を務め、科学的証拠と国際政策の橋渡し役を担っている
。
彼の構想するガバナンスは具体的だ。規制によって企業は、自社のAIシステムの能力や訓練データ、消費リソース、もたらすリスク、そしてそれらに対処する社内プロセスについて完全な透明性を確保しなければならない 。
そしてこの取り組みには、世界のAI超大国による関与が不可欠だ。米中両政府の主導がなければ、こうした安全ガードレールを義務付ける拘束力のあるルールは絵に描いた餅のままだろう。もはやこの問題は、国家および世界の安全保障問題である、と彼は論じている 。
長年、ベンジオ氏の警告には絶望的な終局性がつきまとっていた。しかし、それが変わった。2025年6月、彼は故郷モントリオールに非営利の研究所 LawZero を設立。約3000万ドル(約45億円)の資金を、スカイプの共同創業者ヤーン・タリン、元グーグルCEOのエリック・シュミット、Future of Life Institute、Open Philanthropyなどから集めた 。その名は、アイザック・アシモフのロボット工学三原則に先立つ「ロボット工学第零法則」――すなわち「人類への保護を何よりも優先せよ」に由来する
。
現在の目標追求型の自律AIとは対照的に、Scientist AIは世界に対して独立した行動を起こさない「非エージェント」システムである。その役割は純粋な理解、説明、検証に徹することだ。他のAIシステムにおける欺瞞、目標のズレ、危険な計画を検知し、阻む「真実追求型のガードレール」として設計されている 。その出力は、不透明なコマンドではなく、透明性の高い推論と確率評価だ
。
「ベンジオ氏は、人間を模倣するAIを構築する代わりに、まるで超然とした科学者のように振る舞うAIを望んでいる。自己保存や制御不能な主体性のリスクを低減するためだ」と評される 。同研究所には、商業的要請よりも安全性を最優先する世界トップクラスの研究者が集結し、後付けの安全策ではなく「設計段階からの安全性(Safety-by-Design)」を基盤とする次世代AIモデルの構築を目指している
。
Comments
0 comments