커맨드 라인 기반의 에이전트 코딩을 테스트하는 Terminal-Bench 2.1에서는 **74.6%**를 기록했습니다. 이는 GPT-5.5의 78.2%에는 뒤쳐지지만, 동일한 평가에서 오푸스 4.7이 기록한 66.1%보다 크게 향상된 수치입니다 . 에이전트 컴퓨터 사용 능력 평가인 OSWorld-Verified에서는 **83.4%**로 오푸스 4.7(82.8%)과 GPT-5.5(78.7%)를 모두 앞질렀습니다
.
지식 노동자 업무 능력을 가늠하는 GDPval-AA 테스트에서 오푸스 4.8은 1,890 Elo를 기록하며 GPT-5.5(1,769)와 제미나이(1,314)를 큰 차이로 따돌렸습니다 . 다학제적 추론 능력을 평가하는 Humanity's Last Exam에서는 도구 사용 시 57.9%, 미사용 시 49.8%를 기록하며 앤트로픽의 일반 공개 모델 중 가장 높은 점수를 달성했습니다
.
앤트로픽은 오푸스 4.8을 의미 있는 수준으로 더 정직한 모델이라고 강조합니다. 자체 평가에 따르면, 스스로 생성한 코드의 결함을 눈감아 주거나 모르는 척 넘어갈 확률이 오푸스 4.7보다 약 4배나 낮아졌습니다 .
기만 행위나 악의적인 협력 요청에 응하는 등 의도와 어긋난 행동을 보이는 비율 역시 오푸스 4.7보다 실질적으로 낮으며, 앤트로픽이 최고 수준으로 정렬된 모델로 평가하는 클로드 미토스 프리뷰(Claude Mythos Preview)와 비슷한 수준입니다 . 이는 AI를 활용해 프로덕션 코드를 검토하거나 생성하는 개발자에게 특히 중요한 지점입니다. 자신의 약점을 솔직히 알리지 않고 결함 있는 결과물을 자신만만하게 전달하는 모델 대신, 스스로의 맹점을 인지하고 깃발을 꽂는 모델이 필요하기 때문입니다.
사용자 입장에서 가장 눈에 띄는 변화는 클로드.ai와 카우워크(Cowork) 인터페이스에 새롭게 추가된 노력 제어 다이얼입니다 . 이제 사용자는 응답에 투입될 컴퓨팅 자원의 수준을 선택할 수 있습니다:
클로드 코드에서는 높은 노력 수준에서 발생하는 더 많은 토큰 사용량을 수용하기 위해 속도 제한(Rate Limit)이 상향 조정되었습니다 . 이를 통해 개발자는 복잡한 코딩이나 에이전트 작업에서 지연 시간, 비용, 추론 깊이 사이의 균형을 더 세밀하게 조정할 수 있게 되었습니다.
대규모 문제를 해결하는 개발자를 위해, 앤트로픽은 **클로드 코드(Enterprise, Team, Max 플랜 대상)**에 '동적 워크플로우(Dynamic Workflows)'의 연구 프리뷰 버전을 선보입니다 .
이 기능을 사용하면 클로드가 작업을 계획한 후, 단일 세션에서 수백 개의 병렬 하위 에이전트를 생성하고 실행할 수 있습니다. 각 하위 에이전트의 결과물은 최종 보고 전에 검증 과정을 거치기 때문에, 수십만 줄의 코드에 걸친 코드베이스 규모의 마이그레이션 작업에도 적합한 안정성을 갖추게 됩니다 .
오푸스 4.8의 기본 가격은 이전과 동일하게 입력 토큰 백만 개당 $5, 출력 토큰 백만 개당 $25입니다 . 프롬프트 캐싱 쓰기 및 갱신 비용도 프리미엄 오푸스 등급과 동일하게 유지됩니다
.
더 획기적인 가격 변화는 속도 측면에서 일어났습니다. 오푸스 4.8의 패스트 모드는 최대 2.5배 빠른 출력 토큰 생성 속도를 제공하며, 이제 입력 백만 토큰당 $10, 출력 백만 토큰당 $50의 비용이 부과됩니다 . 이는 오푸스 4.6 및 4.7 시절 $30/$150이었던 패스트 모드 가격보다 3배나 저렴해진 것입니다
. 앤트로픽은 오푸스 4.6의 패스트 모드를 공식적으로 중단하고, 사용자들이 오푸스 4.8 혹은 4.7의 패스트 모드로 이전할 것을 권고하고 있습니다
.
API로 패스트 모드를 사용하려면, 모델 ID claude-opus-4-8과 함께 speed: "fast"fast-mode-2026-02-01 베타 헤더를 포함시키면 됩니다 . 이 기능은 200k 이상의 입력 토큰을 포함하는 전체 컨텍스트 창에 걸쳐 프리미엄 요율의 배수로 가격이 책정되며, 프롬프트 캐싱 및 데이터 레지던시 배수와도 중첩 적용됩니다
.
이 모델은 오늘부터 클로드 API에서 claude-opus-4-8이라는 별칭으로 사용할 수 있으며, 패스트 모드, 프롬프트 캐싱, 배치 처리 구성이 지원됩니다 . 앤트로픽의 API 문서 및 플랫폼 릴리스 노트를 통해 Pro, Max, Team, Enterprise 플랜 고객이 즉시 오푸스 4.8에 접근할 수 있음을 확인했습니다
.
오푸스 4.8 출시와 함께, 앤트로픽은 미토스급(Mythos-class) 모델을 언제쯤 일반에 공개할지에 대한 입장을 한층 분명히 했습니다. 2026년 4월 7일 이후, 클로드 미토스 프리뷰는 **프로젝트 글래스윙(Project Glasswing)**을 통해 약 50개의 방어적 보안 파트너에게만 제한적으로 제공되어 왔습니다 . 이 모델의 공격적 사이버 보안 능력이 워낙 뛰어나 대중 공개를 보류해 온 것입니다
.
하지만 5월 28일, 앤트로픽은 **"앞으로 몇 주 내에 미토스급 모델을 모든 고객에게 출시할 계획"**이라고 공개 언급의 수위를 업데이트했습니다 . 이는 글래스윙 출범 이후 회사가 내놓은 가장 명확한 타임라인입니다. 여기에 더해, 포스트 머니(Post-money) 기준 9,650억 달러의 기업가치를 인정받으며 650억 달러 규모의 시리즈 H 투자 유치 소식도 함께 공개했습니다. 이는 미토스급 모델이 연구 프리뷰 단계를 넘어 상업화의 길로 빠르게 접어들고 있음을 보여주는 신호탄이나 다름없습니다
.
클로드 오푸스 4.8은 점진적인 업그레이드로 보일 수 있지만, 실무자에게는 다음 세 가지 실질적인 차이를 만들어 냅니다:
전환을 고려하는 팀이라면, 가장 좋은 판단 방법은 실제 자신들의 코딩, 에이전트, 지식 노동 작업에 직접 오푸스 4.8을 테스트해 보는 것입니다. 특히 자기 수정, 불확실성 신호 감지, 병렬 하위 에이전트 조정 능력이 중요한 장시간 실행 세션에서 그 진가를 확인할 수 있을 것입니다.
Comments
0 comments