こうした企業はMythosを使って重要なソフトウェアの監査を行い、発見された問題を開発者へ報告する形で防御的に活用しています。
限定公開にもかかわらず、Mythosはすでに驚くべき成果を出しています。
報告によれば、このモデルは次のような能力を示しています。
さらに、一部の報告ではMythosがソフトウェア問題解決能力を測るベンチマーク**SWE-bench Verifiedで約93.9%**を記録したとも伝えられています。ただし、この数値はすべての公式資料で完全に確認されているわけではありません。
これほど強力な能力のため、Mythosは**防御にも攻撃にも使える「デュアルユース技術」**と見なされています。
通常、MythosはProject Glasswingの参加者だけが利用できるモデルです。
そのため、Claudeの通常の開発者インフラ内で名前が確認されたという報告は、いくつかの可能性を示唆します。
ただし、現時点では公式な公開計画は確認されていません。
Mythosは技術面だけでなく、政策や国家安全保障の議論も呼んでいます。
Mythosが象徴するのは、AIの役割の変化です。
従来のAIは開発者を補助するツールでした。しかし新しい世代のモデルは、
というレベルに近づいています。
AnthropicがMythosをProject Glasswingという限定的な形で公開したのは、そのリスクを慎重に扱うためです。
それでも、今回の開発者ツールでの一瞬の出現は、将来的にこうした高度なセキュリティAIが開発プラットフォームに組み込まれる可能性を示唆しているのかもしれません。
もしそれが実現すれば、ソフトウェアの脆弱性が発見されるスピードと、修正までのサイクルは大きく変わることになります。
Comments
0 comments