AI 코딩 에이전트는 대규모 코드베이스를 빠르게 분석할 수 있지만, 보안 리뷰에서는 허위 경보(false positive), 환각된 취약점, 일관성 없는 분석 같은 문제가 자주 발생한다. 암스테르담의 사이버보안 기업 Hadrian이 공개한 오픈소스 프로젝트 OpenHack은 이런 문제를 해결하기 위해 만들어졌다.
OpenHack의 핵심 아이디어는 간단하다. LLM을 단순한 채팅형 도구로 사용하는 대신 정해진 보안 감사 워크플로 안에서 단계적으로 작업하게 만드는 것이다. 이를 통해 모델이 즉흥적으로 코드를 평가하는 대신, 실제 보안 감사처럼 체계적으로 취약점을 조사하도록 유도한다.
OpenHack은 AI 기반 소스 코드 보안 리뷰를 위한 파일 기반 워크스페이스와 도구 세트다. 프로젝트에는 프롬프트, 분석 워크플로, 문서, CLI 도구 등이 포함되어 있으며, LLM이 코드베이스를 어떻게 분석하고 취약점을 보고할지 절차를 정의한다.
이 도구는 다음과 같은 **에이전트형 AI 코딩 환경(agentic coding environments)**과 함께 사용하도록 설계됐다.
이런 환경에서는 AI 에이전트가 저장소를 탐색하고 작업을 수행하며 프로젝트 구조를 이해할 수 있기 때문에, OpenHack의 구조화된 보안 분석 절차를 실행하기 쉽다.
또한 OpenHack은 보안 감사를 별도의 프로젝트로 진행하는 대신 개발 워크플로 안에서 반복 가능한 보안 리뷰 프로세스로 실행할 수 있게 한다.
LLM에게 단순히 “이 저장소에서 취약점을 찾아라”라고 요청하면 결과가 신뢰하기 어려운 경우가 많다. Hadrian이 지적한 주요 문제는 다음과 같다.
OpenHack은 이러한 문제를 해결하기 위해 열린 질문형 프롬프트 대신 구조화된 조사 방법론을 사용한다.
OpenHack의 가장 중요한 개념 중 하나는 **시나리오 기반 범위 설정(scenario‑based scoping)**이다.
즉, AI에게 “취약점을 찾아라”라고 포괄적으로 지시하는 대신, 특정 공격 시나리오를 중심으로 분석하게 만든다.
예를 들어 다음과 같은 분석을 지시할 수 있다.
이 방식은 모델의 분석 범위를 좁히고 명확한 목표를 제공해 불필요하거나 일반적인 보안 지적을 줄이고 실제 공격 경로 분석에 집중하게 한다.
OpenHack 워크플로는 취약점 발견(discovery)과 검증(validation)을 분리하는 구조를 갖는다.
일반적인 실행 흐름은 다음과 같다.
이 구조는 단일 모델의 판단에 의존하지 않게 하며, 증거 기반 분석을 강제해 약한 보고서나 오탐을 줄이는 효과를 노린다.
Hadrian은 OpenHack과 유사한 방법론을 사용해 네덜란드 정부 기관이 사용하는 오픈소스 애플리케이션을 분석했다고 밝혔다.
회사에 따르면 AI 기반 감사 과정에서 몇 시간 안에 수백 개의 보안 문제가 발견됐다.
연구에서 언급된 대표적인 사례는 다음과 같은 공격 체인이었다.
다만 이러한 결과는 현재까지 벤더 자체 보고에 기반한 사례이기 때문에, 독립적인 검증이 추가로 필요하다는 점은 고려해야 한다.
Hadrian은 OpenHack을 MIT 라이선스로 GitHub에 공개했다. 프로젝트에는 다음이 포함된다.
회사 측 설명에 따르면 목표는 AI 기반 취약점 발견 능력을 방어 측에도 개방하는 것이다. 공격자가 독점적으로 이런 도구를 개발하면 방어 측이 뒤처질 수 있기 때문이다.
OpenHack은 더 큰 흐름의 일부이기도 하다. 최근 개발 환경에서는 AI 코딩 에이전트가 다음과 같은 역할을 수행하기 시작했다.
이러한 능력을 보안 감사에 체계적으로 적용하려는 시도가 바로 OpenHack 같은 프로젝트다.
결국 핵심은 단순히 더 강력한 모델이 아니라 분석 범위를 명확히 하고, 증거를 수집하며, 결과를 검증하는 구조화된 워크플로다. 이런 접근이 자리 잡는다면 AI 기반 코드 보안 리뷰의 신뢰성도 점점 높아질 가능성이 있다.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
OpenHack은 Hadrian이 공개한 오픈소스 워크플로로, Claude Code·Codex·Cursor 같은 LLM 코딩 에이전트를 구조화된 보안 코드 리뷰어로 활용할 수 있게 만든다.
OpenHack은 Hadrian이 공개한 오픈소스 워크플로로, Claude Code·Codex·Cursor 같은 LLM 코딩 에이전트를 구조화된 보안 코드 리뷰어로 활용할 수 있게 만든다. 시나리오 기반 분석과 발견·검증 분리 방식의 독립적 트리아지를 통해 LLM 코드 리뷰에서 흔한 허위 경보와 환각 취약점 문제를 줄이는 것이 핵심이다.
이 방법론은 네덜란드 정부가 사용하는 오픈소스 애플리케이션 감사에서 테스트되어 수백 개의 취약점을 발견했으며, 인증 없는 LFI에서 Azure 자격 증명 노출로 이어지는 공격 경로도 보고됐다.
Loading comments...
Comments
0 comments