LLMはコードを理解できますが、単純に
「このリポジトリの脆弱性を探して」
と指示するだけでは、実用的な結果にならないことが多いとHadrianは指摘しています。
主な問題は次の通りです。
OpenHackの特徴の一つが、シナリオベースのスコーピングです。
AIに「何か問題を探して」と任せるのではなく、具体的な攻撃シナリオを与えて調査させます。
例えば次のような調査です。
もう一つの重要な設計が、発見(discovery)と検証(triage)を分離することです。
典型的なOpenHackの流れは次のようになります。
Hadrianによると、この手法はオランダ政府機関が使用しているオープンソースアプリケーションの監査でも使用されました。
紹介されている事例の一つでは、次のような攻撃チェーンが確認されたとされています。
HadrianはOpenHackをMITライセンスでGitHubに公開しました。
リポジトリには以下が含まれています。
OpenHackは、ソフトウェアセキュリティ分野で進む大きな流れを象徴しています。
OpenHackのような構造化されたワークフローは、その能力をセキュリティ監査に応用する試みです。
単にAIにレビューさせるのではなく、
といったプロセスを設計することで、LLMを信頼できる脆弱性リサーチャーに近づけることが狙いです。
AI主導の開発環境が広がるにつれ、こうしたアプローチは今後のセキュリティレビューの標準になっていく可能性があります。
Comments
0 comments