보고서게시됨2개월 전Last edited 지난달37 소스

클로드 오푸스 4.8 출시: 더 정직해지고 똑똑해진 AI, '미토스(Mythos)' 공개 초읽기

앤트로픽, 2026년 5월 28일 클로드 오푸스 4.8 출시. 기존과 동일한 가격($5/$25, 입력/출력 백만 토큰당)으로 오푸스 4.7의 직접적인 업그레이드 버전 클로드.ai 및 클로드 코드에서 AI의 추론 깊이를 조절하는 '노력 제어(Effort Control)' 기능과 최대 수백 개의 병렬 하위 에이전트를 실행하는 '동적 워크플로우(Dynamic Workflows)' 프리뷰 공개 앤트로픽, 강력한 사이버 보안 역량으로 그간 비공개였던 '미토스(Mythos)'급 모델을 수 주 내로 전 고객에게 출시할 것임을 공식 언급

Studio Global AI로 검색 및 팩트체크 인기 페이지 더 보기

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

AI 프롬프트

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

앤트로픽(Anthropic)이 2026년 5월 28일, 기존 최상위 공개 AI 모델이었던 클로드 오푸스 4.7(Claude Opus 4.7)을 대체하는 신규 플래그십 모델 클로드 오푸스 4.8을 전격 공개했습니다. 이번 출시는 획기적인 아키텍처 변화보다는, 모델의 정직성과 코딩 성능을 대폭 끌어올리고 사용자 제어 기능을 강화하는 '정밀 업그레이드'에 초점을 맞춘 것이 특징입니다. 놀라운 점은 핵심 가격을 그대로 유지했다는 것입니다 .

앤트로픽의 공식 블로그는 오푸스 4.8을 오푸스 4.7의 성과를 기반으로 여러 벤치마크를 개선한 "더욱 효과적인 협업자"라고 소개합니다 . 이 말은 곧, 잘못된 코드를 승인하도록 속이기 더 어려워졌고, 개발자와 일반 사용자 모두가 더 쉽게 통제할 수 있으며, 고속 모드의 실행 비용이 획기적으로 저렴해졌다는 의미입니다.

오푸스 4.7 대비 벤치마크 향상

오푸스 4.8은 앤트로픽의 주요 평가 테스트에서 측정 가능한 성과 향상을 기록했습니다. 실제 버그 수정 능력을 평가하는 최고 권위의 테스트인 SWE-Bench Verified에서 오푸스 4.8은 **88.6%**를 기록하며 오푸스 4.7의 87.6%를 넘어섰습니다 .

하지만 더 의미 있는 도약은 SWE-Bench Pro에서 이루어졌습니다. 이는 다중 언어 에이전트 코딩 능력을 평가하는 훨씬 더 까다로운 테스트인데요, 오푸스 4.8은 **69.2%**를 달성하며 오푸스 4.7의 64.3%보다 4.9포인트나 높은 점수를 기록, GPT-5.5(58.6%) 및 제미나이 3.1 프로(54.2%)와의 격차를 두 자릿수로 벌렸습니다 .

커맨드 라인 기반의 에이전트 코딩을 테스트하는 Terminal-Bench 2.1에서는 **74.6%**를 기록했습니다. 이는 GPT-5.5의 78.2%에는 뒤쳐지지만, 동일한 평가에서 오푸스 4.7이 기록한 66.1%보다 크게 향상된 수치입니다 . 에이전트 컴퓨터 사용 능력 평가인 OSWorld-Verified에서는 **83.4%**로 오푸스 4.7(82.8%)과 GPT-5.5(78.7%)를 모두 앞질렀습니다 .

지식 노동자 업무 능력을 가늠하는 GDPval-AA 테스트에서 오푸스 4.8은 1,890 Elo를 기록하며 GPT-5.5(1,769)와 제미나이(1,314)를 큰 차이로 따돌렸습니다 . 다학제적 추론 능력을 평가하는 Humanity's Last Exam에서는 도구 사용 시 57.9%, 미사용 시 49.8%를 기록하며 앤트로픽의 일반 공개 모델 중 가장 높은 점수를 달성했습니다 .

정직성 및 정렬: 한층 더 안전해진 모델

앤트로픽은 오푸스 4.8을 의미 있는 수준으로 더 정직한 모델이라고 강조합니다. 자체 평가에 따르면, 스스로 생성한 코드의 결함을 눈감아 주거나 모르는 척 넘어갈 확률이 오푸스 4.7보다 약 4배나 낮아졌습니다 .

기만 행위나 악의적인 협력 요청에 응하는 등 의도와 어긋난 행동을 보이는 비율 역시 오푸스 4.7보다 실질적으로 낮으며, 앤트로픽이 최고 수준으로 정렬된 모델로 평가하는 클로드 미토스 프리뷰(Claude Mythos Preview)와 비슷한 수준입니다 . 이는 AI를 활용해 프로덕션 코드를 검토하거나 생성하는 개발자에게 특히 중요한 지점입니다. 자신의 약점을 솔직히 알리지 않고 결함 있는 결과물을 자신만만하게 전달하는 모델 대신, 스스로의 맹점을 인지하고 깃발을 꽂는 모델이 필요하기 때문입니다.

클로드.ai와 클로드 코드에 적용된 '노력 제어' 기능

사용자 입장에서 가장 눈에 띄는 변화는 클로드.ai와 카우워크(Cowork) 인터페이스에 새롭게 추가된 노력 제어 다이얼입니다 . 이제 사용자는 응답에 투입될 컴퓨팅 자원의 수준을 선택할 수 있습니다:

낮음(Low): 속도 제한을 천천히 소모하며 더 빠르게 응답합니다.
높음(High): 오푸스 4.8의 새로운 기본값으로, 품질과 속도 사이의 최적 균형을 제공합니다.
추가(Extra): 클로드 코드 설정에서는 xhigh로 표기됩니다. 까다로운 작업이나 장시간 실행되는 워크플로우에 권장되는 수준으로, 더욱 철저하게 추론합니다.
최대(Max): 가장 어려운 문제를 위한 최고 수준의 심층 추론 모드입니다 .

클로드 코드에서는 높은 노력 수준에서 발생하는 더 많은 토큰 사용량을 수용하기 위해 속도 제한(Rate Limit)이 상향 조정되었습니다 . 이를 통해 개발자는 복잡한 코딩이나 에이전트 작업에서 지연 시간, 비용, 추론 깊이 사이의 균형을 더 세밀하게 조정할 수 있게 되었습니다.

클로드 코드의 '동적 워크플로우'

대규모 문제를 해결하는 개발자를 위해, 앤트로픽은 **클로드 코드(Enterprise, Team, Max 플랜 대상)**에 '동적 워크플로우(Dynamic Workflows)'의 연구 프리뷰 버전을 선보입니다 .

이 기능을 사용하면 클로드가 작업을 계획한 후, 단일 세션에서 수백 개의 병렬 하위 에이전트를 생성하고 실행할 수 있습니다. 각 하위 에이전트의 결과물은 최종 보고 전에 검증 과정을 거치기 때문에, 수십만 줄의 코드에 걸친 코드베이스 규모의 마이그레이션 작업에도 적합한 안정성을 갖추게 됩니다 .

가격 정책과 패스트 모드

오푸스 4.8의 기본 가격은 이전과 동일하게 입력 토큰 백만 개당 $5, 출력 토큰 백만 개당 $25입니다 . 프롬프트 캐싱 쓰기 및 갱신 비용도 프리미엄 오푸스 등급과 동일하게 유지됩니다 .

더 획기적인 가격 변화는 속도 측면에서 일어났습니다. 오푸스 4.8의 패스트 모드는 최대 2.5배 빠른 출력 토큰 생성 속도를 제공하며, 이제 입력 백만 토큰당 $10, 출력 백만 토큰당 $50의 비용이 부과됩니다 . 이는 오푸스 4.6 및 4.7 시절 $30/$150이었던 패스트 모드 가격보다 3배나 저렴해진 것입니다 . 앤트로픽은 오푸스 4.6의 패스트 모드를 공식적으로 중단하고, 사용자들이 오푸스 4.8 혹은 4.7의 패스트 모드로 이전할 것을 권고하고 있습니다 .

API로 패스트 모드를 사용하려면, 모델 ID claude-opus-4-8과 함께


speed: "fast"

로 설정하고 fast-mode-2026-02-01 베타 헤더를 포함시키면 됩니다 . 이 기능은 200k 이상의 입력 토큰을 포함하는 전체 컨텍스트 창에 걸쳐 프리미엄 요율의 배수로 가격이 책정되며, 프롬프트 캐싱 및 데이터 레지던시 배수와도 중첩 적용됩니다 .

API 가용성 및 모델 식별자

이 모델은 오늘부터 클로드 API에서 claude-opus-4-8이라는 별칭으로 사용할 수 있으며, 패스트 모드, 프롬프트 캐싱, 배치 처리 구성이 지원됩니다 . 앤트로픽의 API 문서 및 플랫폼 릴리스 노트를 통해 Pro, Max, Team, Enterprise 플랜 고객이 즉시 오푸스 4.8에 접근할 수 있음을 확인했습니다 .

프로젝트 글래스윙과 다가오는 미토스급 출시

오푸스 4.8 출시와 함께, 앤트로픽은 미토스급(Mythos-class) 모델을 언제쯤 일반에 공개할지에 대한 입장을 한층 분명히 했습니다. 2026년 4월 7일 이후, 클로드 미토스 프리뷰는 **프로젝트 글래스윙(Project Glasswing)**을 통해 약 50개의 방어적 보안 파트너에게만 제한적으로 제공되어 왔습니다 . 이 모델의 공격적 사이버 보안 능력이 워낙 뛰어나 대중 공개를 보류해 온 것입니다 .

하지만 5월 28일, 앤트로픽은 **"앞으로 몇 주 내에 미토스급 모델을 모든 고객에게 출시할 계획"**이라고 공개 언급의 수위를 업데이트했습니다 . 이는 글래스윙 출범 이후 회사가 내놓은 가장 명확한 타임라인입니다. 여기에 더해, 포스트 머니(Post-money) 기준 9,650억 달러의 기업가치를 인정받으며 650억 달러 규모의 시리즈 H 투자 유치 소식도 함께 공개했습니다. 이는 미토스급 모델이 연구 프리뷰 단계를 넘어 상업화의 길로 빠르게 접어들고 있음을 보여주는 신호탄이나 다름없습니다 .

개발자와 팀을 위한 의미

클로드 오푸스 4.8은 점진적인 업그레이드로 보일 수 있지만, 실무자에게는 다음 세 가지 실질적인 차이를 만들어 냅니다:

오푸스 4.7에서 넘어오려는 팀이라면, 동일한 비용으로 바로 교체 투입 가능합니다. 코딩 벤치마크 성능이 더 좋아졌고, 코드 품질에 대한 자체 평가의 정직성은 극적으로 개선되었습니다.
높은 처리량의 출력이 자주 필요했지만, 이전의 $30/$150 패스트 모드 비용이 부담스러웠다면, $10/$50으로 낮아진 새 가격 정책은 더 넓은 범위의 프로덕션 워크로드에서 사용을 고려할 만한 매력적인 조건입니다.
미토스급 모델을 아키텍처에 포함시킬 계획이 있는 팀이라면, 앤트로픽의 달라진 말투는 제한된 프리뷰 단계가 막바지에 이르렀으며 조만간 일반 API 접근이 가능해진다는 뜻입니다. 정확한 날짜와 안전 제어 장치에 대한 구체적인 정보는 아직 확인되지 않았지만 말입니다.

전환을 고려하는 팀이라면, 가장 좋은 판단 방법은 실제 자신들의 코딩, 에이전트, 지식 노동 작업에 직접 오푸스 4.8을 테스트해 보는 것입니다. 특히 자기 수정, 불확실성 신호 감지, 병렬 하위 에이전트 조정 능력이 중요한 장시간 실행 세션에서 그 진가를 확인할 수 있을 것입니다.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI로 검색 및 팩트체크

사람들은 또한 묻습니다.