OpenAIのPreparedness Frameworkの下で、GPT-5.5はサイバーセキュリティ能力において「High」と評価された。これは「Critical」の閾値(人間の助けなしで自律的にゼロデイエクスプロイトを開発する能力と定義される)を下回っていることを意味する。ある評価では、GPT-5.5(およびCyberバリアント)は32ステップのネットワーク攻撃シミュレーションを完了し、AnthropicのMythosに次いでAIとして2例目と報告されている
。
OpenAIは、更新されたCodex Securityプラグインを発表した。これは脆弱性の発見、検証、修正をCodex内の開発者ワークフローに直接組み込むものである。このプラグインは静的解析を超えた機能を提供するよう設計されている。脅威モデルの構築または推論、実現可能な脆弱性の特定、影響を受けるコードが到達可能かどうかの判断、検証証拠の収集、対象を絞ったパッチの開発、結果の検証が可能である
。OpenAIは、このプラグインが内部および顧客の使用から得られた教訓を組み込み、既存システムの脆弱性の発見と修正を加速すると同時に、新しい脆弱性が本番環境に到達することを防ぐと述べている
。2026年3月の研究プレビュー以来、Codex Securityプラグインは30,000以上のコードベースにわたって3,000万回以上のコミットをスキャンし、人間のレビュー担当者は70,000件以上の発見を手動でマークした
。
Patch the Planetは、Daybreak拡大の中核をなすオープンソースイニシアチブであり、Trail of Bits、HackerOne、Califとのパートナーシップの下で構築された。OpenAIはこれを「人間によるレビューを中心に、セキュリティの発見からマージされた修正へとオープンソースメンテナーを導く取り組み」と説明している
。このプログラムは、Trail of Bitsの専任セキュリティエンジニアに資金を提供し、彼らはCodexとGPT-5.5-Cyberを使用してオープンソースプロジェクトにフルタイムで取り組み、バグの発見だけでなく、修正プログラムの作成とマージを目的としている
。
注目すべき発見例としては、8件のLinuxカーネルポインターリークの概念実証、システムユーティリティにおける24件のローカル権限昇格ベクター、10件以上の悪用可能なSafari脆弱性、Pwn2Ownの前に修正されたFirefox WebAssemblyのCVE(CVE-2026-8390)、および公開修正前に独立してフラグが立てられた6件中4件のdnsmasq CVEが含まれる。対象プロジェクトには、cURL、NATS、pyca/cryptography、Sigstore、aiohttp、Goプロジェクト、freenginx、Pythonおよびpython.org、urllib3、PyPI、SimpleX、Valkey、RustCryptが含まれていた
。Trail of Bitsのエンジニアは、GPT-5.5-CyberでCodexの
/goalを繰り返し実行し、1週間未満で数十のエントリーポイント、プラットフォーム、新しいテストシードをカバーするファジングラボ全体を構築した。これは通常、少なくとも数週間はかかると見積もられている。
OpenAIは、招待制のDaybreakサイバーパートナープログラムを開始した。このプログラムは、セキュリティベンダーにOpenAIの最先端サイバー機能(Trusted Accessを含むGPT-5.5など)へのアクセスを提供し、自社の製品やサービスに組み込むことを可能にする。このプログラムは、「大手セキュリティ企業が世界のソフトウェアを保護するために、当社の最高のサイバー機能を活用した製品を構築できるようにする」ことを目的としている
。
2026年5月のDaybreakローンチ時のより広範なパートナーリストには、Cloudflare、Oracle、Zscaler、Akamai、Fortinet、Intel、Qualys、Rapid7、Trail of Bits、SpecterOps、SentinelOne、Netskope、Snyk、Gen Digital、Semgrep、Socketも含まれていた。
今回の拡大は、OpenAIのDaybreakをAnthropicのProject GlasswingおよびMythos AIモデルと直接競合させるものである。入手可能な証拠に基づくと、両社の取り組みは戦略が異なり、流動的な競争環境を示している。
全体として、両社は異なるベンチマークと能力領域でリーダーシップを入れ替えている。OpenAIの民主化への重点(オープンソース修正、広範なパートナー統合、開発者組み込みツール)は、Anthropicのより制御されたエリート重視の展開戦略とは対照的である。両モデルともそれぞれの強みの分野で最先端であり、競争力学は今後も進化し続ける可能性が高い。
Comments
0 comments