수출 통제의 직접적 발단은 소위 '제일브레이크'(jailbreak, AI의 안전장치를 무력화하는 공격 기법) 신고였습니다. 그러나 그 심각성을 두고 양측의 입장은 크게 갈렸습니다.
이견은 빠르게 고조되었습니다. 복수의 보도에 따르면 아모데이는 관리들과의 통화에서 강하게 반발하며 정부의 우려를 '오해'라고 규정했고, 한때 협상은 완전히 결렬될 위기까지 갔습니다 .
백악관은 페이블 5를 새로운 AI 행정명령에 따른 안전장치의 테스트 케이스로 지정하고, 상무부, 재무부, 백악관을 총동원해 대응했습니다 . 행정부는 이 모델의 능력이 중국의 사이버 보안 공격 도구 접근 및 기타 위험한 이중 용도 기술로 이어질 수 있다고 우려했습니다
.
수출 통제 위기가 있은 지 며칠 만에, 백악관과 앤트로픽은 대립에서 구조화된 협상으로 전환했습니다 . 2026년 4월 17일, 아모데이는 백악관 관료들을 만나 생산적인 휴전 협상을 진행했으며, 이는 앤트로픽과 국방부 사이의 이전 마찰 이후 처음 있는 고위급 접촉이었습니다
.
이후 고위급 회의에는 미국 상무장관 하워드 러트닉(Howard Lutnick), 국가사이버국장 숀 케언크로스(Sean Cairncross), 앤트로픽 공동 창업자 톰 브라운(Tom Brown) 등이 참여했습니다 . 행정부는 페이블 5 테스트 케이스를 위해 상무부, 재무부, 백악관 간의 공조를 이끌어냈습니다
.
이러한 회담에서 탄생한 핵심 프로젝트는 프론티어 AI 모델의 보안 취약점, 특히 제일브레이크의 심각성을 평가하기 위한 통합 준수 프레임워크입니다 . 이 프레임워크는 안전 결함이 정부 개입을 정당화하는지 여부를 평가하기 위한 공통 벤치마크를 만드는 것을 목표로 합니다
.
이 노력의 핵심에는 제일브레이크에 대한 통합 등급 시스템이 있습니다. '치명적', '높음', '중간', '낮음'과 같은 공식적인 분류명이나 세부 평가표가 아직 공개되지는 않았지만, 이 프레임워크는 세 가지 위험 평가 기준을 사용하는 것으로 알려졌습니다 :
정부의 목표는 이 등급 시스템을 사용하여, 위기 발생 후 임시방편으로 대응하는 것이 아니라, 수출 통제 부과, 완화 조치 요구, 배포 차단 등을 자동으로 결정하는 명확하고 사전 정의된 위험 임계값을 확립하는 것입니다 .
백악관의 궁극적인 목표는 '사후 대응적이고 위기 주도적인 개입'에서 '규칙 기반 시스템'으로 전환하는 것입니다 . 앤트로픽과 함께 등급 프레임워크와 위험 임계값을 공동 개발함으로써, 백악관은 다음을 목표로 합니다:
핵심 불확실성: 프레임워크의 세부 기준, 범위, 일정 등은 아직 공개되지 않았습니다. 3가지 위험 평가 기준(우회된 보호 장치, 노출된 능력, 실제 세계 영향)은 여러 매체를 통해 보도되었지만 구체적인 점수 매기기 방법론은 공개되지 않았습니다 .
미국-앤트로픽 프레임워크 개발은 G7 차원의 AI 안전 표준 논의를 배경으로 이루어지고 있습니다. G7은 프론티어 AI 위험 평가를 위한 국제적으로 조화된 벤치마크를 마련하기 위해 노력해 왔습니다 . 백악관과 앤트로픽이 구축 중인 통합 등급 시스템은 이러한 G7의 다자간 논의에 정보를 제공하고, 반대로 그 논의 내용을 반영할 것으로 예상되지만, 구체적인 G7 결과물은 아직 협상 중입니다
.
이 프레임워크의 개발은 미국 AI 정책에서 중요한 전환점을 의미합니다. 수출 통제가 있기 불과 며칠 전, 아모데이는 정부가 독립적인 안전 테스트를 통과하지 못한 프론티어 AI 모델의 배포를 차단하거나 되돌릴 수 있는 강제적 법적 권한을 보유해야 한다는 내용의 정책 에세이를 발표했습니다 . 6월 12일의 위기는 이 원칙을 예상치 못한 대립으로 시험대에 올렸습니다.
여전히 남아있는 핵심 질문은 '좁고 관리 가능한 취약점'과 '정부 개입을 정당화하는 시스템적 위험' 사이의 경계선을 어떻게 정의할 것인가입니다. 이에 대한 답변은 앤트로픽의 미래 모델 출시뿐만 아니라, 프론티어 AI 개발에 대한 광범위한 규제 환경을 결정짓는 중요한 요소가 될 것입니다.
Comments
0 comments