중요한 점은, 그녀의 경고가 AI가 모든 보안 연구원을 당장 대체할 것이라는 뜻은 아니라는 데 있습니다. 오히려 AI가 '역량의 문턱'을 넘으면서, 누가(혹은 무엇이) 가장 치명적인 취약점을 먼저 발견하느냐의 경제적 구도 자체가 바뀌고 있다는 것입니다. 팔미오티는 그 종착점이 결국 기계 쪽일 것이라고 주장합니다.
클로드 미토스 프리뷰는 단순한 사이버 보안 도구가 아닙니다. 이는 앤트로픽의 차세대 범용 언어 모델로, 기존 클로드 시리즈의 뒤를 잇는 모델입니다. 해커가 되도록 특별히 훈련된 적도 없습니다. 하지만 능력 평가 결과, 그 성과는 개발자들조차 충격에 빠뜨렸습니다.
앤트로픽은 미토스 프리뷰가 모든 주요 운영체제와 모든 주요 웹 브라우저에서 심각도 높은 취약점 수천 건을 자율적으로 발견했다고 확인했습니다. 여기에는 그 어떤 인간 연구원도 아직 발견하지 못한, 알려지지 않은 제로데이(Zero-Day) 결함도 포함됩니다. 한 보고서는 이 모델이 단 21분 만에 303페이지에 달하는 취약점 보고서를 만들어 냈다고 설명합니다
.
이전의 AI 모델도 때때로 취약점을 찾아내긴 했지만, 제대로 작동하는 공격 코드(익스플로잇)를 스스로 만드는 경우는 거의 없었습니다. 파이어폭스의 자바스크립트 엔진에서 발견된 알려진 취약점을 셸(Shell)을 탈취하는 익스플로잇으로 만드는 벤치마크 테스트에서, 미토스 프리뷰는 무려 181번이나 성공했습니다. 앤트로픽의 이전 최고 모델인 '클로드 오퍼스 4.6'의 성공률이 거의 0%에 가까웠던 점을 고려하면, 이는 단순한 점진적 개선이 아니라 역량의 문턱 자체를 넘어선 것으로 평가됩니다.
미토스는 사람이 읽을 수 있는 디버깅 정보가 제거된, 소스 코드가 공개되지 않은 채 컴파일된 소프트웨어도 분석할 수 있습니다. 기계 수준의 원시 코드를 검사하고, 프로그램 작동 방식을 이해하며, 소스 코드 접근 없이는 파악하기 어려운 취약점을 찾아냅니다.
연구원들은 매우 단순한 환경을 구축했습니다. 대상 코드베이스를 컨테이너로 감싸고, 미토스 프리뷰가 적용된 클로드 코드 도구를 불러낸 뒤, 취약점을 찾으라는 단락 하나짜리 프롬프트를 입력했습니다. 그러자 AI는 사람의 추가 개입 없이 이전에 알려지지 않은 보안 허점을 스스로 식별하고 익스플로잇을 작성했습니다. 영국의 AI 안전 연구소(AISI)도 독립적인 평가를 통해 미토스의 고급 사이버 능력을 확인했습니다
.
앤트로픽이 분명히 밝혔듯, 이 모델의 공격적 사이버 능력은 의도적으로 훈련된 것이 아닙니다. 이 능력은 "코드, 추론 능력, 자율성에 대한 일반적인 개선의 파생 결과로 등장"한 것입니다. 취약점을 패치(수정)하는 모델을 더 효과적으로 만드는 바로 그 개선점이 취약점을 공격하는 데도 똑같이 효과적으로 작용한 것입니다. 이것은 AI 거버넌스에 엄청난 시사점을 던집니다. 만약 공격 능력이 일반적인 추론력의 자연스러운 산물이라면, 미래의 더 뛰어난 모델들은 근본적으로 지능을 제한하지 않는 한 안전하게 만드는 것이 불가능할 수도 있기 때문입니다
.
앤트로픽은 2026년 4월 클로드 미토스 프리뷰를 출시하면서, 주요 AI 연구소로는 전례 없는 행보를 보였습니다. 가장 강력한 모델을 발표함과 동시에 일반 대중은 사용할 수 없다고 못 박은 것입니다.
회사는 **프로젝트 글래스윙(Project Glasswing)**이라는 제한된 접근 프로그램을 만들어 미토스 프리뷰의 사용을 약 50곳의 엄선된 조직으로 제한했습니다. 여기에는 애플, 아마존 웹 서비스, 마이크로소프트, 구글, 시스코, 크라우드스트라이크, 브로드컴, 팔로알토 네트웍스, 엔비디아 같은 주요 기술 기업과 JP모건 체이스 같은 핵심 인프라 운영사가 포함됩니다. 미국 국가안보국(NSA)을 비롯한 미국 정부 기관도 접근 권한을 부여받았습니다. 목표는 세상에서 가장 중요한 소프트웨어를 먼저 방어하는 것입니다. 유사하거나 더 강력한 공격형 AI가 불가피하게 확산되기 전에, 수비 측에 먼저 기회를 주는 셈입니다
.
앤트로픽의 논리는 명쾌합니다. 모델이 광범위하게 배포되기에는 단순히 너무 위험하다는 것입니다. 회사는 미토스가 "현재 사이버 능력 면에서 다른 어떤 AI 모델보다 훨씬 앞서 있으며" "수비 측의 노력을 훨씬 능가하는 방식으로 취약점을 악용할 수 있는 다가오는 모델의 물결을 예고한다"고 스스로 인정했습니다. 엉뚱한 손에 들어가면 전력망, 병원, 금융 시스템에 대한 조직적인 사이버 공격을 조율할 수도 있습니다
.
상황은 앤트로픽이 접근 권한을 약 50곳에서 120곳으로 확대하겠다고 제안하면서 걷잡을 수 없이 커졌습니다. 백악관은 이 확대 계획을 저지했습니다. 이는 특정 법률이나 규정이 아닌 정책적 고려를 바탕으로 미국 정부가 AI 모델의 상업적 출시를 제한한 최초의 사례로 기록되었습니다. 정부 관계자들은 이 모델이 적대적인 세력의 손에 들어갈 수 있다는 우려와, 앤트로픽이 중요한 연방 기관 파트너의 서비스 품질을 저하시키지 않으면서 확장된 사용자 집단을 감당할 만큼 충분한 컴퓨팅 자원을 확보했는지에 대한 의구심을 그 이유로 들었습니다
.
한편, 미 국방부는 오픈AI, 구글, 마이크로소프트, AWS, 엔비디아, 스페이스X, 오라클, xAI 등 8개 기업과 기밀 네트워크 AI 파트너십을 발표하면서 앤트로픽을 명단에서 제외해, 이 회사와 미국 방위 기관 사이의 갈등이 고조되고 있음을 시사했습니다.
현재 미토스는 잠긴 문 뒤에 머물러 있습니다. 일본의 3대 메가뱅크(미쓰비시UFJ금융그룹, SMBC, 미즈호)가 2026년 5월에 접근 권한을 얻으면서, 일본은 미국 외 지역에서 방어 목적으로 이 모델을 사용하는 최초의 국가 중 하나가 되었습니다.
클로드 미토스의 등장은 사이버 보안 업계에 철학적 논쟁에 불을 붙였습니다. 인간 취약점 연구원에게 살아남을 미래가 있을까요, 아니면 우리는 종말의 시작을 목격하고 있는 걸까요?
1. AI는 증강할 뿐, 아직 대체할 수 없다. 팔미오티 스스로도 클로드 코드로 효율을 높이면서, 맥락 이해와 창의적 추론은 여전히 인간의 몫이라고 말합니다. 많은 연구원이 상위 레벨의 전략 수립, 시스템의 목적과 비즈니스 로직에 대한 이해, 모델이 아직 재현하지 못하는 창의적인 연쇄 공격 추론에는 인간의 전문성이 여전히 중요하다고 주장합니다.
2. 접근 통제가 인간의 역할을 보존한다. 미토스는 약 50개 조직에만 잠겨 있습니다. 버그 바운티, 침투 테스트, 취약점 평가의 압도적 다수는 아직도 훨씬 덜 강력한 도구를 사용하는 인간 연구원들에 의해 수행됩니다. 이것이 최전선의 판도를 바꾸어 놓기는 하지만, 기존의 거대한 산업 자체가 바로 해체되지는 않습니다.
3. 새로운 영역과 판단력. 인간은 비즈니스 로직 결함을 감지하고, 미묘한 사회공학적 평가를 수행하며, 현재의 AI 모델이 놓치거나 잘못 해석할 수 있는 위험 기반의 맥락적 판단을 내리는 데 여전히 유리한 위치에 있습니다. AI는 기술적으로 악용 가능한 버퍼 오버플로우를 찾을 수 있지만, 인간 연구원은 그 오버플로우가 비즈니스 맥락에서 실제로 중요한 위협인지 판단할 수 있습니다.
1. 순수한 속도와 규모는 인간의 영역을 넘어선다. 미토스는 코드베이스 전체를 읽어 들여 취약점을 찾고 몇 분 만에 익스플로잇을 작성할 수 있습니다. 이는 숙련된 인간 팀이 몇 주 또는 몇 달에 걸쳐 할 수 있는 작업량입니다. 주요 운영체제 전체에서 동시에 수천 개의 알려지지 않은 취약점을 발견한 뒤, 한 매체는 이를 두고 "지구상의 거의 모든 컴퓨터를 해킹할 수 있는 AI"라고 표현했습니다.
2. 엘리트 인간 경연장이 AI의 쇼케이스가 되고 있다. 팔미오티가 Pwn2Own 같은 대회가 무용지물이 될 수 있다고 예측한 것은 단순한 감상이 아닙니다. 구조적 관찰입니다. 하나의 모델이 여러 엘리트 팀이 필요했을 취약점을 찾아내고 연결할 수 있다면, 취약점 발견의 경제 구조가 근본적으로 변합니다.
3. 비용과 효율성의 압도적 우위. 단일 AI 시스템은 수백만 줄의 코드를 스캔하고, 사소한 취약점들을 치명적인 공격 체인으로 연결하며, 인간이 견딜 수 없는 규모로 작업합니다. 이는 취약점 발견에서 가능한 일을 근본적으로 바꾸어 놓습니다. 인간이 무능해서가 아니라, 물량 면에서 경쟁할 수 없기 때문입니다.
이 논쟁은 깔끔하게 결론나기 어려워 보입니다. 가까운 미래는 두 갈래로 나뉠 가능성이 더 큽니다. 엄격한 정부 및 기업의 심사를 받으며 미토스 같은 도구를 사용하는 내부 집단과, 대부분의 보안 작업이 여전히 고집스럽게 인간의 수작업으로 남아 있는 외부 집단 말입니다. 그 두 원 사이의 거리는 점점 좁혀지고 있습니다.
Comments
0 comments