보통 이런 수준의 취약점 연결 분석은 숙련된 보안 연구자가 수행하는 작업으로 알려져 있다.
또 하나의 핵심 발견은 PoC(Proof‑of‑Concept) 익스플로잇 코드 생성 자동화였다.
클라우드플레어의 관찰에 따르면 Mythos는 다음과 같은 반복 과정을 수행할 수 있었다.
보안팀 입장에서는 PoC 코드가 만들어져야 취약점이 실제로 악용 가능한지 확인할 수 있기 때문에, 이 단계가 자동화되면 취약점 검증과 우선순위 설정에 필요한 시간이 크게 줄어든다.
Anthropic의 자체 설명에서도 Mythos Preview의 보안 연구 능력이 강조된다.
내부 테스트에서는 다음과 같은 능력이 보고됐다.
강력한 능력에도 불구하고 테스트에서는 몇 가지 중요한 문제도 발견됐다.
모델이 실제로는 악용 불가능한 취약점을 보고하는 경우가 있었다. 특히 C나 C++ 같은 메모리 안전성이 낮은 언어로 작성된 프로젝트에서 이런 오탐이 더 많이 나타났다. 따라서 최종 검증에는 여전히 인간 연구자의 확인이 필요하다.
또 다른 문제는 안전 정책에 따른 거부 행동이 일관되지 않다는 점이었다.
이는 보안 연구에 유용한 기능과 악용 방지 장치 사이의 균형을 맞추는 것이 얼마나 어려운지를 보여준다.
이번 실험은 AI가 취약점 연구 방식 자체를 바꿀 수 있음을 시사한다.
방어 측면에서는 이런 시스템이 다음과 같은 역할을 할 수 있다.
하지만 같은 능력은 공격자에게도 도움이 될 수 있다. 버그 발견에서 실제 공격 코드 생성까지의 장벽이 크게 낮아질 수 있기 때문이다.
클라우드플레어는 특히 **“단순히 패치를 더 빨리 하는 것만으로는 충분하지 않을 수 있다”**는 점을 강조했다. AI가 취약점을 더 빠르게 발견하고 연결할 수 있는 환경에서는 취약점 관리와 보안 아키텍처 자체가 바뀌어야 할 가능성이 있다는 것이다.
Claude Mythos Preview는 전형적인 이중 용도(dual‑use) 기술의 사례다.
이러한 이유로 Mythos Preview는 일반 공개 모델이 아니라 제한된 파트너에게만 제공되고 있다. 현재는 Project Glasswing 프로그램을 통해 일부 기업과 기관이 방어 목적의 보안 테스트에만 사용할 수 있다.
클라우드플레어의 실험 결과는 한 가지 분명한 메시지를 남긴다. AI는 이제 단순히 코드를 작성하는 도구를 넘어, 취약점 발견부터 공격 논리 구성까지 이해하는 ‘전면적 보안 분석 시스템’으로 발전하고 있다는 것이다. 앞으로 이 기술이 사이버 방어와 공격 양쪽 모두의 전략을 크게 바꿀 가능성이 있다.
Comments
0 comments