실제 보안 팀 입장에서는 또 다른 문제가 생길 수 있다. AI가 너무 많은 잠재적 취약점을 찾아내면 **검증해야 할 후보가 폭증하면서 ‘트리아지 과부하’**가 발생할 수 있기 때문이다.
초기 보도에서는 Mythos가 독보적인 사이버 능력을 가진 모델처럼 묘사되기도 했지만, 정부 테스트에서는 경쟁 모델도 빠르게 따라오고 있는 모습이 나타난다.
AISI의 평가에 따르면:
일부 분석에서는 GPT‑5.5가 어려운 “Expert” 난이도 문제에서 Mythos와 대체로 비슷한 성공률을 기록했다는 보도도 있다. 다만 이러한 수치는 AISI의 전체 데이터 공개 이전까지는 참고 수준으로 보는 것이 안전하다 .
이 때문에 업계에서는 성능 경쟁을 단순히 모델 자체가 아니라 도구 체계·워크플로·보안 전문지식과 결합된 시스템 전체로 봐야 한다는 의견도 나온다.
AI 사이버 성능을 평가할 때 중요한 문제는 실험 환경과 현실 환경의 차이다.
AISI 테스트는 정부 주도의 신뢰도 높은 평가이지만, 연구기관 스스로도 다음과 같은 점을 인정한다.
연구 환경에서는 종종 다음과 같은 요소가 단순화된다.
하지만 현실의 시스템은 불완전한 로그, 복잡한 권한 구조, 패치 부작용, 잘못된 경보 등 다양한 변수가 존재한다.
따라서 벤치마크 성능이 실제 침해 가능성과 정확히 동일하다고 보기는 어렵다.
그럼에도 불구하고 각국 정부와 금융기관은 이런 모델에 큰 관심을 보이고 있다.
이유는 단순하다. 공격자도 같은 기술을 사용할 수 있기 때문이다.
보안 업계에서는 “AI가 취약점을 발견하는 속도가 인간보다 빨라질 가능성” 때문에, 방어 측 역시 같은 도구를 먼저 사용해야 한다는 인식이 확산되고 있다.
AISI 연구에 따르면 AI가 자율적으로 수행할 수 있는 사이버 작업의 길이는 빠르게 증가하고 있다.
영국 국가사이버보안센터(NCSC)도 최신 AI가 이미 다음과 같은 단계에서 실제 도움을 주고 있다고 경고했다.
결국 Mythos와 같은 모델은 **방어 도구이면서 동시에 공격 능력을 가속할 수 있는 ‘이중 용도 기술(dual‑use)’**이라는 평가가 나온다.
현재까지 공개된 독립 평가를 종합하면 Mythos는 분명 취약점 탐지와 사이버 실험을 크게 가속하는 강력한 도구다.
하지만 동시에 다음 질문들은 아직 완전히 답이 나오지 않았다.
그래서 현재 보안 전문가들의 가장 현실적인 평가는 이렇다.
Mythos는 “완전한 AI 보안 분석가”가 아니라, 매우 강력하지만 신중하게 다뤄야 할 고성능 보안 보조 도구에 가깝다.
Comments
0 comments