これは、世界中で行われてきた標準モデルへの莫大な計算投資を、将来の新発見のための再利用可能なリソースへと変えることに成功したことを意味する。DESIのような大規模プロジェクトの主要な障害を、見事に回避したのだ 。
この研究の最も重要な警鐘は、この革新的な技術の「失敗の仕方」を正確に特定した点にある。
新しい物理現象の効果が、AIがΛCDMモデルから既に学習したパターンと酷似している場合、AIの事前知識は強力な「先入観」となり、大きな負債へと変わる。この現象は負の転移と呼ばれ、ファインチューニングによってパフォーマンスが逆に悪化するという皮肉な結果を招く 。
その根本原因は、物理的な縮退にある。例えば、重いニュートリノが宇宙論に刻む痕跡——小スケールでの物質の集団化(クラスタリング)の抑制——は、標準的なΛCDM宇宙において、物質密度ゆらぎの振幅(σ₈)が単に低い場合の痕跡と、極めてよく似ている。事前学習でΛCDMの「常識」を深く刷り込まれたAIは、ニュートリノのシグナルに直面すると、それを「標準モデル内の単なるパラメータ変化」と誤解釈し、誤った結論を導き出してしまうのだ 。
ある報告が指摘するように、AIは標準モデルのパラメータ間の関連性を深層ネットワークのバイアスとしてエンコードしており、「そのバイアスは、訓練の目的が何か新しいものを検出することになった途端、負債となる」のである 。
幸いなことに、すべての転移学習手法が同じように脆弱なわけではない。この研究は異なるネットワーク構造を体系的にテストし、特別な「ダミーネットワーク」設計を用いない単純なファインチューニング手法が、負の転移をはるかに起こしやすいことを発見した。
Comments
0 comments