具体的には次のような課題があります。
Mythosの能力が話題になった一方で、AISIの評価ではOpenAIのGPT‑5.5も同等レベルのサイバー能力を示しています。
外部報道では、難易度の高いサイバータスクでGPT‑5.5の成功率が約71.4%だったとされ、Mythosとほぼ同程度の結果だったという分析もあります。ただし詳細データは限定的で、慎重な解釈が必要です 。
このため現時点では、性能の差は「モデル単体」よりも
といったシステム全体の設計に左右される可能性が高いと見られています。
AIサイバー能力の評価には、テスト環境の問題もあります。
研究者が指摘する典型的なギャップには次のようなものがあります。
つまり、実験環境で強いモデルがそのまま現場で同じ性能を出すとは限りません。
それでも金融機関や政府がMythosの導入検討を急いでいる理由は明確です。
AIがサイバー攻撃のコストとスピードを変えつつあるためです。
英国の国家サイバーセキュリティセンター(NCSC)は、最先端AIがすでに
そのため金融機関は、攻撃者より先にAIで脆弱性を見つけて修正する必要があると考えています。
実際、報道によると日本では
現在の証拠を総合すると、Mythosは確かに
といった分野で非常に強力なAIツールです。
しかし同時に、
などの点では、まだ人間の専門家を置き換える段階にはないと考えられています。
むしろ現実的な見方は、Mythosを
「攻撃にも防御にも使える高レバレッジのAIアシスタント」
と捉えることです。これが、政府や金融機関が急いで評価・導入を進めている理由でもあります。
同時に、この分野は急速に進化しており、AISIの観測ではAIが自律的にこなせるサイバー作業の難易度は数か月単位で倍増しているとされています 。つまり、Mythosはゴールではなく、AIサイバー能力の新しい段階の始まりに過ぎない可能性があります。
Comments
0 comments