Anthropic이 발표한 초기 보고서에 따르면 결과는 상당히 공격적이다.
이 결과는 기존 수동 코드 감사보다 훨씬 빠른 속도로 취약점을 찾아낼 수 있음을 시사한다.
외부 평가에서도 보안 능력은 상당히 높은 것으로 나타났다.
영국 **AI Security Institute(AISI)**는 Claude Mythos Preview가 전문가 수준의 CTF(캡처 더 플래그) 보안 문제의 73%를 해결했다고 보고했다.
CTF 문제는 실제 취약점 탐지와 익스플로잇 개발 능력을 평가하기 위해 보안 연구자들이 사용하는 대표적인 테스트다.
Anthropic과 관련 분석에 따르면 이 모델은 다음과 같은 능력을 보였다.
이는 단순 정적 분석 도구 수준을 넘어, 숙련된 보안 연구자의 작업 일부를 자동화하는 단계에 가깝다는 평가가 나온다.
대부분의 취약점은 아직 패치 과정에 있기 때문에 상세 내용은 공개되지 않았다. 다만 일부 사례는 알려졌다.
보고된 사례는 다음과 같다.
Project Glasswing은 하나의 연구 프로젝트라기보다 대규모 보안 협력 네트워크에 가깝다.
초기 참여 조직으로 알려진 곳은 다음과 같다.
각 참여 기관은 자체 소프트웨어와 주요 오픈소스 프로젝트에 모델을 적용해 취약점을 찾고 패치를 진행한다.
Anthropic이 Mythos를 공개하지 않는 이유는 단순하다.
자동으로 제로데이 취약점을 발견하고 익스플로잇까지 생성하는 시스템이 공개될 경우, 공격자의 진입 장벽이 크게 낮아질 수 있다.
그래서 Anthropic은 다음 전략을 택했다.
헤드라인 수치가 인상적인 만큼, 보안 업계에서는 신중한 시각도 존재한다.
Anthropic의 발표가 사실이라면 Project Glasswing은 역사상 가장 큰 규모의 AI 기반 취약점 탐지 프로젝트 중 하나다.
다만 대부분의 취약점이 아직 공개되지 않았기 때문에, 보안 커뮤니티에서는 실제 영향과 독립적 검증을 기다리는 단계라는 평가가 많다.
확실한 것은 하나다. AI는 이제 단순한 코드 작성 도구를 넘어 소프트웨어 보안 연구 자체를 자동화하는 단계로 빠르게 이동하고 있다는 점이다.
Comments
0 comments