가장 위험한 취약점은 CVE-2026-10881로, 구글 크롬의 그래픽 레이어인 ANGLE에서 발생한 범위 밖 읽기/쓰기(Out-of-bounds read and write) 결함이다. CVSS 점수 9.6점을 기록했으며, 특수 제작된 HTML 페이지만으로도 크롬의 샌드박스를 탈출해 시스템을 장악할 수 있는 취약점이었다 . 또한 이번 패치에 포함된 다수의 치명적 버그는 브라우저에서 흔히 발생하는 메모리 안전 문제인 'Use-After-Free(해제된 메모리 재사용)' 유형이었다
.
구글 엔지니어들은 전체 429개 중 약 371개를 자체적으로 발견했으며, 나머지는 외부 보안 연구자들이 신고했다. 구글은 이들에게 **20만 9천 달러(한화 약 2억 7천만 원)의 버그 바운티(취약점 신고 포상금)**를 지급했다 . 보안 매체 시큐리티위크(SecurityWeek)는 크롬의 결함 급증이 취약점 사냥에 AI 활용이 늘어난 데 따른 것으로 보이며, 이 때문에 구글이 2026년 4월 크롬 버그 바운티 지급액을 낮추기까지 했다고 분석했다
.
구글은 공개 당시 이 취약점들이 실제로 악용된 사례는 없다고 밝혔다 . 그러나 이 어마어마한 패치 규모는 '가장 뛰어난 엔지니어링 팀조차 AI 기반 발견 물결에 과연 대응할 수 있을까'라는 심각한 운영적 의문을 던진다.
크롬 149가 공개되던 바로 그때, 보안 스타트업 뎁스퍼스트는 FFmpeg를 상대로 한 자사 AI 에이전트의 실험 결과를 발표했다. FFmpeg는 거의 모든 동영상 처리의 기반이 되는 오픈소스 멀티미디어 라이브러리로, 수많은 애플리케이션과 기기에 내장되어 있다 .
뎁스퍼스트의 AI 에이전트는 약 150만 줄의 C 코드를 분석해 이전에 공개된 적 없는 21개의 제로데이 취약점을 찾아냈다. 이 버그들 중 일부는 무려 15년에서 20년 동안 아무도 모르게 방치되어 있었다 . 이 취약점들은 TS 디먹서(demuxer)부터 VP9 디코더에 이르기까지 다양한 구성 요소에서 발생한 **힙 오버플로(Heap Overflow)와 스택 오버플로(Stack Overflow)**가 대부분이었다
.
더욱 주목할 점은 뎁스퍼스트의 AI가 단순히 의심스러운 코드를 지적하는 데 그치지 않고, 각 버그에 대해 실제 작동하는 개념 증명(PoC) 입력값까지 생성해 결과를 입증했다는 것이다 . 이 모든 작업에 투입된 총 컴퓨팅 비용은 약 1,000달러에 불과했다
.
비교를 위해, 앤트로픽(Anthropic)의 미토스(Mythos) 모델은 이전에 FFmpeg에서 16년 된 H.264 결함을 찾아내는 데 약 1만 달러(한화 약 1,300만 원)를 소요한 바 있다 . 뎁스퍼스트는 이번 결과를 10분의 1 비용으로 동등한 성과를 낸 것으로 평가했다
. 그 함의는 명확하다. 한때 국가 기관이나 자금력 있는 연구소의 전유물이던 정교한 제로데이 발견이 이제는 누구나 감당할 수 있는 클라우드 이용료 수준으로 접근하고 있다.
크롬과 FFmpeg 이야기는 단독 사례가 아니다. 2025년과 2026년을 거치며 가속화된 더 큰 패턴 속에 존재한다.
구글의 프로젝트 제로(Project Zero) 산하 AI 에이전트 '빅 슬립(Big Sleep)'은 2024년 11월, 실제 운영 중인 소프트웨어(SQLite)에서 AI가 최초로 인-프로덕션(In-production) 제로데이를 발견한 사례를 기록했다 . 이후 속도는 더욱 빨라졌다. 제로패스(ZeroPath)의 AI 보조 정적 분석은 2025년 말 FFmpeg에서 7개의 취약점을 찾아냈고
, 앤트로픽의 미토스 모델은 OpenBSD, FreeBSD, 리눅스, 파이어폭스, 암호화 라이브러리 등에서 16년에서 27년까지 숨어 있던 취약점들을 연이어 찾아냈다
. 2026년 4월, 미토스는 파이어폭스를 대상으로 한 익스플로잇(공격 코드) 작성에서 181회 성공해 이전 세대 모델 대비 90배 향상된 성과를 냈다
.
크롬 149 패치 자체도 이 새로운 속도감을 직접 반영한다. 시큐리티위크에 따르면, 2026년 6월 발표된 429건의 수정은 2025년 한 해 동안 출시된 모든 크롬 보안 패치의 총합을 이미 넘어섰다 .
버그를 찾는 것은 빠르지만, 고치는 것은 여전히 인간의 몫이다. 크롬 149는 구글 같은 막대한 엔지니어링 자원과 성숙한 취약점 관리 프로그램을 갖춘 조직조차 거대한 백로그(처리 대기 목록)에 직면할 수 있음을 증명했다 . 소규모 오픈소스 유지 관리자들에게 상황은 더 심각하다. FFmpeg의 소수 핵심 팀은 이제 뎁스퍼스트뿐 아니라 구글의 빅 슬립, 앤트로픽의 미토스 등 여러 AI 도구가 대량으로 쏟아내는 취약점 보고서를 분류(triage)하고, 검증하고, 패치를 개발해야 한다
. 실제로 FFmpeg 프로젝트는 구글의 AI가 제출한 버그 일부가 30년 된 비디오 게임과 관련된 난해한 코드를 지적한 것을 두고 ‘CVE 슬롭(CVE Slop)’이라 칭하며 공개적으로 불만을 표하기도 했다
.
자원이 풍부한 수비자라면 이제 코드를 출시하기 전에 자신의 코드베이스를 대상으로 여러 AI 모델을 실행해 볼 수 있고, 실제로 많은 조직이 그렇게 하고 있다. 하지만 이 경제성은 누구에게나 동일하게 적용된다. 일리노이 대학교(UIUC) 연구에 따르면 AI 보조 공격의 평균 비용은 GPT-4 사용 시 취약점당 8.80달러였지만, 숙련된 인간 연구자의 경우 25달러로 추정되었다 . 뎁스퍼스트의 1,000달러짜리 FFmpeg 작업은 **제로데이 건당 비용을 약 48달러(한화 약 6만 원)**까지 낮췄으며, 이후 하드웨어와 모델 개선에 따라 비용은 더 하락할 가능성이 크다
.
반면 수비자들은 여전히 수동적이고 시간이 많이 소요되는 패치 및 배포 작업을 해야 한다. 이 비대칭 구조는 점점 더 커지고 있다.
AI 기반 취약점 발견의 급속한 대중화는 공포보다 실질적인 대응을 요구한다. 보안 팀은 이제 국가 차원이든 아니든 위협 행위자들이 이미 자신의 조직이 의존하는 소프트웨어에 이런 모델을 실행하고 있다고 가정해야 한다.
가장 현실적인 조치는 먼저 자신의 코드베이스에 AI 보안 에이전트를 실행하는 것이다. 공격자가 심각한 버그를 찾기 전에 먼저 찾아서 수정하는 것이 최선의 방어책이다. 패치 지연 시간 줄이기도 못지않게 중요하다. 취약점 공개와 패치 배포 사이의 간격은 이제 AI 시대에 가장 위험한 시간대이므로, 소프트웨어 공급망을 스캔하고 업데이트 당일 적용하는 것을 최우선시해야 한다. 또한 취약점 공개를 '과부하' 문제로 인식해야 한다. 대다수 팀은 AI가 생성한 갑작스러운 보고서 홍수를 감당할 여력이 없으므로, 신호와 소음을 걸러내는 자동 검증 파이프라인을 구축하거나 도입하는 것이 곧 소프트웨어 보안 유지를 위한 전제 조건이 될 것이다.
크롬 149의 초대형 패치와 뎁스퍼스트의 1,000달러짜리 FFmpeg 공략은 예외적인 사건이 아니라 이정표다. AI 모델들은 이제 수십 년간의 인간 검토와 수백만 건의 자동 퍼즈(fuzz) 테스트에서도 살아남은 버그를 값싸고 대규모로 찾아낸다. CSA(Cloud Security Alliance)의 연구 노트가 정리했듯, 이제 최첨단이 아닌 AI 모델들조차 제로데이를 찾을 수 있게 되었다 .
병목 현상은 더 이상 '찾는 것'이 아니다. 그 이후의 모든 과정이다. 더 나은 자동화, 더 빠른 배포 파이프라인, 또는 소프트웨어 안전에 대한 새로운 아키텍처적 접근을 통해 방어 측의 방정식이 따라잡을 때까지, 기록을 경신하는 각각의 패치와 각각의 초저비용 취약점 발견 작업은 업계가 결코 무시할 수 없는 경고가 될 것이다.
Comments
0 comments