시스코는 이 모델들을 구동하기 위해 자체 개발한 ‘시스코 파운드리 시큐리티 스펙’이라는 프레임워크를 사용했습니다. 시스코는 “모델이 가속 페달이라면, 이 프레임워크는 엔진”이라며, 6개의 다른 최첨단 AI 모델에서도 작동하도록 설계되었다고 설명했습니다 .
시스코는 최첨단 AI를 방어적 사이버 보안에 활용하려는 양대 산업 진영 모두의 창립 멤버입니다.
앤트로픽의 ‘프로젝트 글래스윙’: 2026년 4월 출범한 이 프로젝트는 공격자가 취약점을 악용하기 전에 선제적으로 찾아내 패치하는 것을 목표로, 신중하게 선별된 파트너들에게 클로드 미토스 프리뷰 접근 권한을 부여합니다. 창립 멤버로는 AWS, 애플, 구글, 마이크로소프트, 엔비디아, 크라우드스트라이크, 리눅스 재단, 그리고 시스코가 참여하고 있습니다 . 발견된 취약점은 책임 있는 공개 프레임워크를 통해 소프트웨어 유지 관리자에게 보고됩니다
.
오픈AI의 ‘데이브레이크’: 2026년 5월 11일 발표된 데이브레이크는 프로젝트 글래스윙에 대한 오픈AI의 직접적인 대응입니다. GPT-5.5와 코덱스 시큐리티를 기반으로 구축되었으며, 대규모 코드 검토 및 패치 검증을 자동화하는 보안 특화 에이전트 프레임워크 뒤에 세 가지 모델 등급을 묶어 제공합니다. 시스코는 클라우드플레어, 크라우드스트라이크, 팔로알토 네트웍스와 함께 창립 생태계 파트너로 참여했습니다 .
이 두 이니셔티브는 AI 업계의 근본적인 철학적 분열을 보여줍니다. 앤트로픽은 가장 위험한 모델에 대한 접근을 통제하는 것이 글로벌 사이버 보안을 강화하는 최선의 방법이라고 주장하는 반면, 오픈AI는 AI 지원 방어자를 광범위하게 배치하기 위해 모든 수준의 정부 기관을 포함한 더 넓은 계층별 접근을 추진하고 있습니다 .
시스코가 밝힌 이번 작업의 동기는 간단했습니다. AI 기반 공격은 더 이상 이론이 아니며, 방어자들은 인간의 속도로 움직일 여유가 없다는 것입니다. 앤트로픽이 클로드 미토스 프리뷰의 출시를 보류한다고 발표했을 당시, 이 모델이 이미 인터넷과 경제 기반을 이루는 핵심 소프트웨어 인프라의 약점을 파악했다는 사실도 동시에 밝혀졌습니다 . 그 의미는 명확했습니다. 방어팀이 이 모델들을 먼저 사용하지 않으면, 적들이 결국 유사한 능력에 접근하게 될 것이라는 겁니다.
시스코는 이 피할 수 없는 현실에 맞서는 경쟁으로 이번 18억 줄 코드 스캔을 규정했습니다. 시스코는 최첨단 모델들이 “이전에는 결코 달성할 수 없었던 규모로 취약점을 찾아내고 있으며, 이것은 일회성이 아니다. 이 모델들은 계속해서 새로운 취약점을 찾아낼 것”이라고 밝혔습니다 . 시스코는 전체 포트폴리오를 스캔함으로써, 악의적인 의도를 가진 공격자가 유사한 모델을 사용해 동일한 약점을 찾아내기 전에 앞서 나가는 것을 목표로 삼았습니다.
속도와 규모에 대한 호들갑에도 불구하고, 시스코는 가장 중요한 질문에 대한 답변을 체계적으로 피했습니다. AI가 실제로 얼마나 많은 취약점을 찾아냈는가 하는 점입니다. 여러 보도에 따르면 시스코는 발견된 취약점의 “총개수를 밝히는 것을 거부”했으며, 집계, 심각도 분류, 중요하거나 악용 가능한 취약점의 개수 등 어떤 정보도 제공하지 않았습니다 .
이러한 침묵은 명백한 신뢰성 문제를 야기합니다. AI가 수천 개의 심각한 버그를 발견했다면 그 숫자를 공개하는 것이 전체 작업을 입증할 강력한 근거가 되었을 것입니다. 그러나 동시에 고객과 규제 당국을 놀라게 할 수도 있습니다. 반대로, 발견된 버그가 상대적으로 적었다면 ‘8년 작업을 8주 만에’라는 프레임은 그 근거를 잃게 됩니다. 어느 쪽이든, 시스코는 AI 스캔 작업의 “변혁적인 힘”을 칭송하면서도 그 핵심 성과 지표는 비공개로 남겼습니다 .
이번 시스코 라이브 2026에서는 구체적이고 실행 가능한 변화도 하나 발표되었습니다. 시스코는 7월부터 기존의 임시 취약점 공개 방식을 폐지하고 예측 가능한 정기 공개 방식으로 전환합니다. 이제 시스코는 매월 첫째 주와 셋째 주 수요일에 보안 권고문을 발표하며, 각 공개 7일 전에 사전 예고를 통해 어떤 기술과 플랫폼이 포함될지 미리 알릴 예정입니다 .
이러한 변화의 배경에는 AI 스캔 프로그램이 직접적으로 자리 잡고 있습니다. 시스코 제품 보안 사고 대응팀(PSIRT)은 AI로 인한 취약점 발견 속도가 빨라지면서 발견되는 취약점의 양이 급격히 증가할 것으로 예상하고 있습니다. 월 2회 공개 주기는 기업 고객들이 갑작스러운 보안 권고문에 당황하지 않고 패치 일정을 계획할 수 있도록 예측 가능성을 제공하기 위해 설계되었습니다 . 만약 특정 공개 기간에 예정된 보안 발표가 없다면, 시스코는 그 사실 또한 별도로 알릴 것입니다
.
시스코가 자사 코드를 스캔하는 동안, 영국 AI 안전 연구소(AISI)는 시스코가 사용한 두 모델을 독립적으로 평가하고 있었습니다. 그 결과는 충격적이었습니다. 2026년 4월과 6월 사이에 발표된 일련의 평가에서 AISI는 다음과 같은 사실을 발견했습니다 :
클로드 미토스 프리뷰는 “이전에 평가한 어떤 모델보다 사이버 공격 능력이 훨씬 뛰어납니다.” 영국 정부는 이 사실을 인용하여, 모든 영국 비즈니스 리더들에게 AI 기반 사이버 위험을 최우선 거버넌스 책임으로 다룰 것을 촉구하는 공개 서한을 발표했습니다 . 미토스 프리뷰는 전문가 수준의 CTF(해킹 방어 대회) 작업에서 73%의 성공률을 기록했는데, 이는 연구소가 평가한 어떤 모델에서도 처음 있는 일입니다
.
GPT-5.5는 AISI의 32단계 기업 네트워크 공격 시뮬레이션을 처음부터 끝까지 완료했으며, 이는 인간 전문가가 약 20시간 동안 수행할 작업량으로 추정됩니다. 또한 95개의 좁은 범위의 CTF 사이버 과제로 구성된 평가에서 너무 높은 점수를 받아, 더 이상 최첨단 모델의 사이버 위험을 측정하기에 기존 벤치마크가 불충분해지는 현상이 발생했습니다 . 전문가 수준의 고급 작업에서 GPT-5.5는 약 71%의 평균 통과율을 기록했으며, 이전 세대인 GPT-5.4는 약 52%에 그쳤습니다
.
전반적인 추세는 가속화되고 있습니다: AISI는 최첨단 AI 모델이 사이버 작업을 자율적으로 완료하는 능력이 현재 4.7개월마다 2배씩 증가하고 있다고 밝혔습니다. 이는 2025년 11월에 측정된 8개월 간격에서 크게 단축된 수치입니다. 클로드 미토스 프리뷰와 GPT-5.5는 이 가파른 추세선마저 크게 상회하는 성능을 보였습니다 .
4.7개월마다 능력이 2배가 된다는 것의 의미는 명확합니다. 만약 이 추세가 유지된다면, 약 1년 반 안에 AI 시스템은 오늘날 전문 해커 팀이 몇 주나 몇 달을 작업해야 하는 사이버 작업을 자율적으로 완료할 수 있게 될 것입니다. AISI는 두 모델의 최신 버전이 이미 기존 95개 평가 작업 세트를 포화시켜 모델 능력의 전체 범위를 측정할 수 없게 되면서 “시간적 지평을 매우 불확실”하게 만들었다고 지적했습니다 .
AISI의 평가 결과와 함께 시스코의 발표는 업계가 AI가 촉발한 방어적 군비 경쟁을 받아들이고 적극적으로 참여하고 있다는 그림을 그려줍니다. 18억 줄의 코드에서 취약점을 스캔할 수 있는 동일한 최첨단 모델이 이론적으로는 공격자들에 의해 인간 레드팀보다 더 빠르게 동일한 취약점을 찾아내 악용하는 데 사용될 수 있습니다.
프로젝트 글래스윙과 데이브레이크의 논리는 공격 능력이 확산되기 전에 가장 능력 있는 모델을 가장 책임감 있는 조직에 먼저 제공하여 핵심 인프라를 패치하는 것이 최선의 방어라는 것입니다. 시스코의 18억 줄 코드 스캔은 이 명제에 대한 현재까지 가장 큰 규모의 실제 테스트입니다. 그러나 실제 버그 개수를 공개하지 않기로 한 시스코의 결정은 업계에 아슬아슬하지만 불완전한 개념 증명만을 남겼습니다. 대신, AI 기반의 새로운 공개 주기를 통해 발견된 취약점의 양이 영구적인 운영 변화를 필요로 할 만큼 상당했음을 강하게 암시하고 있습니다.
Comments
0 comments