답변게시됨2주 전Last edited 2주 전32 소스

오픈 웨이트 모델의 반란: Z.ai의 GLM-5.2, GPT-5.5를 넘어 클로드에 도전하다

Z.ai의 GLM 5.2는 753B MoE 모델로, SWE bench Pro(62.1 vs 58.6)와 AIME 2026(99.2 vs 98.1)에서 GPT 5.5를 넘어섰으며, 앤트로픽의 클로드 오푸스 4.8과의 성능 격차를 1% 포인트 이내로 추격했습니다. 완전히 공개된 MIT 라이선스 모델로, 100만 토큰에 달하는 긴 컨텍스트 창을 지원하며 API 이용 비용은 약 4.40달러로 GPT 5.5 대비 6분의 1 수준입니다.

Studio Global AI로 검색 및 팩트체크 인기 페이지 더 보기

203K0

Abstract visualization of Z.ai's GLM-5.2 model benchmarks and competitive performance data against GPT-5.5 and Claude Opus 4.8. — What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameterGLM-5.2 enters the frontier conversation by beating GPT-5.5 on multiple coding benchmarks and closing to within 0.7 points of Claude Opus 4.8 on long-horizon tasks.
AI 프롬프트
Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
openai.com

2026년 6월 16일, 중국 AI 연구소 Z.ai(구 즈푸 AI)가 오픈 웨이트 대형 언어 모델 'GLM-5.2'를 공개하며 AI 최전선의 판도를 뒤흔들었습니다. 이 모델이 단숨에 주목받는 이유는 간단합니다. 핵심 코딩 및 수학 벤치마크에서 오픈AI의 GPT-5.5를 능가하면서도, 비용은 약 6분의 1에 불과하고 누구나 상업적으로 이용 가능한 MIT 라이선스로 풀렸기 때문입니다 . 여기에 더해, 현존 최강자로 꼽히는 앤트로픽의 '클로드 오푸스 4.8'과의 격차를 주요 장기 에이전트 작업에서 약 1% 포인트 차이까지 바짝 추격했습니다 .

아키텍처 개요 및 핵심 사양

GLM-5.2는 혼합 전문가(Mixture-of-Experts, MoE) 아키텍처를 기반으로 설계되었습니다. 이는 모델의 성능과 추론 효율성을 동시에 잡기 위한 전략적 선택입니다. 공식 사양에 따르면 총 약 7,530억 개의 파라미터를 가지고 있지만, 토큰 하나를 처리할 때마다 활성화되는 파라미터는 약 400억 개에 불과합니다 . 바로 이 희소 활성화(sparse activation) 방식 덕분에 파격적인 가성비가 가능해진 것입니다.

핵심 사양 요약:

파라미터: 총 약 7,530억 개, 토큰당 약 400억 개 활성
컨텍스트 윈도우: 1,048,576 토큰 (실사용 가능한 100만 토큰)
최대 출력 토큰: 128K–131K (소스별로 약간의 차이 존재)
라이선스: MIT (상업적 이용 및 연구 목적 제한 없음)
추론 모드: "High"(효율 중시) 및 "Max"(최대 추론 노력) 모드를 지원하여 속도와 깊이를 조절 가능

아키텍처에서 특히 주목할 점은 '인덱스쉐어(IndexShare)' 메커니즘입니다. 100만 토큰이라는 방대한 컨텍스트 창을 경제적으로 운용하기 위해, Z.ai는 4개의 희소 어텐션(sparse-attention) 레이어마다 하나의 경량 인덱서를 재사용하는 방식을 선택했습니다. 기술 분석에 따르면, 이 기법 덕분에 최대 컨텍스트 길이에서 토큰당 연산량을 약 2.9배 절감하여, 장문 컨텍스트 모델에서 흔히 발생하는 성능 저하 문제를 해결했습니다 .

벤치마크 성능: 최정상급 모델들과의 진검승부

Z.ai는 GLM-5.2를 GPT-5.5 및 클로드 오푸스 4.8과 정면으로 비교했습니다. 아래 표의 점수는 경쟁사 모델의 수치를 포함하여 Z.ai가 자체적으로 측정하여 보고한 값입니다. 이는 특정 벤더 한 곳의 측정치이며, 경쟁 연구소에서 독립적으로 재현한 결과가 아니라는 점을 염두에 두셔야 합니다 .

벤치마크	GLM-5.2	GPT-5.5	Claude Opus 4.8
SWE-bench Pro (실제 버그 수정)	62.1	58.6	69.2
Terminal-Bench 2.1 (다단계 터미널 에이전트)	81.0	84.0	85.0
AIME 2026 (올림피아드 수준 수학)	99.2	98.1	~98.0–98.9
FrontierSWE (20시간 복합 엔지니어링)	74.4	72.6	75.1
MCP-Atlas (MCP 서버 기반 도구 사용)	77.0	75.3	77.8

벤치마크에서 드러난 핵심 포인트

GLM-5.2가 여러 코딩 및 추론 평가에서 GPT-5.5를 앞섰습니다. SWE-bench Pro에서 GPT-5.5의 58.6점을 62.1점으로 제쳤으며 , 자율 엔지니어링 능력을 20시간 동안 시험하는 까다로운 FrontierSWE에서도 74.4점을 기록하며 GPT-5.5의 72.6점을 상회했습니다 . 수학 영역인 AIME 2026에서는 99.2점이라는 만점에 가까운 점수로 미국 경쟁사들을 모두 따돌렸습니다 .

에이전트 기반 코딩에서 클로드 오푸스 4.8과의 격차가 극적으로 좁혀졌습니다. 오푸스 4.8은 여전히 SWE-bench Pro(69.2점 vs. GLM-5.2 62.1점) 등 여러 지표에서 확실한 우위를 점하고 있지만 , 장기 에이전트 작업에서는 그 차이가 크지 않습니다. FrontierSWE에서는 불과 0.7점 차이(74.4 vs 75.1) 이며, MCP-Atlas에서도 0.8점 차이(77.0 vs 77.8)에 불과합니다 .

이전 세대 GLM-5.1 대비 세대 교체 수준의 도약이 일어났습니다. 가장 극적인 개선이 이루어진 곳은 Terminal-Bench 2.1로, GLM-5.2의 81.0점은 이전 세대의 62.0점에서 무려 19점이나 오른 수치입니다 . 이는 오픈 웨이트 모델로는 최초로 이 벤치마크에서 80%의 벽을 넘은 사례입니다 .

물론, GLM-5.2가 뒤처지는 부분도 명확히 존재합니다. 초장기 엔지니어링 작업을 평가하는 SWE-Marathon 같은 가장 어렵고 긴 호흡의 과제에서는 오푸스 4.8이 26.0%, GLM-5.2가 13.0%의 성공률을 보이며, 여전히 상당한 격차가 존재합니다. 이는 매우 긴 시간 동안 에이전트를 운용할 때의 안정성 측면에서 미국의 최정상급 모델이 아직 우위에 있음을 보여줍니다 .

가격 및 접근성: 개방형 접근의 경제학

GLM-5.2의 경쟁력은 성능만큼이나 가격에서도 빛을 발합니다.

API 가격: Z.ai의 GLM 코딩 플랜(Lite, Pro, Max, Team 등급)을 통해 이용 가능하며, 비용은 출력 토큰 100만 개당 약 $4.40입니다 . GPT-5.5의 공시된 가격과 비교하면, 이는 운영 비용이 약 83% 저렴하다는 의미입니다 .
허깅페이스에 공개된 가중치: zai-org/GLM-5.2에서 MIT 라이선스로 전체 가중치를 다운로드할 수 있으며, 로컬 배포를 용이하게 하는 양자화된 FP8 버전도 포함되어 있습니다 . 중국 내 사용자들은 ModelScope 플랫폼을 통해서도 다운로드할 수 있습니다 .
서드파티 생태계: Z.ai의 자체 인프라 외에도, Cloudflare Workers AI에서 이용 가능하며 Modular Cloud나 Featherless.ai와 같이 장문 컨텍스트 서비스를 정액제로 제공하는 20개 이상의 서드파티 코딩 환경 및 호스팅 서비스에서도 지원됩니다 .

개방적인 MIT 라이선스와 인프라에 구애받지 않는 배포 모델의 결합은 개발자들이 모델을 자체 호스팅하거나 CI/CD 파이프라인에 통합하여 특정 벤더에 종속되는 것을 피할 수 있게 해줍니다. 폐쇄적인 API 접근 방식만을 고수하는 주요 경쟁사들과는 확연히 대비되는 지점입니다.

전략적 함의: 오픈 웨이트와 미중 AI 패권 경쟁

GLM-5.2의 출시 타이밍은 기술적인 측면 못지않게 상징적입니다. 이 모델이 공개된 바로 그 주, 미국 정부는 앤트로픽의 클로드 파블 5에 대한 규제를 강화했으며, 이 결정에는 아마존 CEO와 백악관 관료들 간의 대화가 영향을 미친 것으로 알려졌습니다 . 그 대비 효과는 의도적이었고 극명했습니다. 미국이 자국의 선도적인 AI 연구소에 대한 통제를 강화하는 바로 그 순간, 중국에서 완전히 개방된 최정상급 모델이 등장한 것입니다.

Z.ai의 창립자는 MIT 라이선스 출시를 발표하며 "최첨단 지능은 모두의 것(Frontier Intelligence Belongs to Everyone)" 이라는 슬로건을 내걸었습니다 . 이는 GLM-5.2가 단순한 기술적 성과를 넘어, 격화하는 미중 기술 경쟁 속에서 하나의 정치적 선언임을 분명히 한 것입니다.

GLM-5.2는 진공 상태에서 나타난 것이 아닙니다. 이는 중국 연구소들이 내놓은 일련의 고성능 오픈 웨이트 모델(딥시크, 알리바바의 Qwen, 바이두의 ERNIE 등)의 최신 버전일 뿐입니다. 이 모델들은 폐쇄적인 미국 최상위 모델들과의 성능 격차를 체계적으로 좁혀나가는 동시에, 훨씬 낮은 가격에 제한 없는 접근권을 제공하고 있습니다 .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI로 검색 및 팩트체크

사람들은 또한 묻습니다.