2026년 6월 13일 오전 5시 21분(한국시간), 중국 AI 기업 지푸(Zhipu) AI의 Z.ai가 조용히 그리고 강렬하게 새로운 모델을 쏟아냈습니다. 이름은 GLM 5.2. 100만 토큰 컨텍스트 윈도우, Claude Code 완전 호환 API, 그리고 MIT 오픈소스 약속까지 — 개발자 커뮤니티가 술렁이기 시작했습니다. "오픈소스가 역대 최고의 한 주를 보내고 있다"는 말이 X(구 트위터)를 달굴 만큼, 이번 GLM 5.2 출시는 단순한 모델 업데이트가 아닙니다. 국경을 초월한 AI의 민주화를 향한 선언입니다.
Z.ai(지푸 AI)는 어떤 회사인가?
Z.ai는 중국 칭화대학교(清華大學)의 지원을 받아 설립된 AI 스타트업으로, 원래 사명은 지푸 AI(Zhipu AI, 智谱AI)입니다. 베이징에 본사를 둔 이 회사는 2019년 설립 이후 중국 최고의 자연어처리(NLP) 연구소 중 하나로 성장했으며, 칭화대의 KEG 연구실과 긴밀한 협력 관계를 유지하고 있습니다.
Z.ai가 전 세계 개발자 커뮤니티에 이름을 알리게 된 것은 GLM(General Language Model) 시리즈를 통해서입니다. 중요한 점은, Z.ai는 단순히 좋은 모델을 만드는 것을 넘어 '오픈소스 AI'라는 철학적 기반을 전면에 내세운다는 사실입니다. 2026년 초, 미국 정부의 일부 프런티어 AI 모델 접근 제한 조치가 이슈가 되자, Z.ai의 CEO 唐杰(Tang Jie)는 공개 성명에서 이렇게 말했습니다.
"AGI로 가는 길은 결코 높은 장벽으로 둘러싸여선 안 됩니다. 우리는 항상 AGI가 소수의 특권이 아닌, 전 인류가 함께 탐험하는 공동의 유산이어야 한다고 믿어왔습니다. 외부의 봉쇄와 제약에 직면한 우리의 태도는 '완전한 개방'입니다. 프런티어 인텔리전스는 오픈소스여야 하고, 모든 헌신적인 개발자가 접근할 수 있어야 합니다." – Tang Jie, Zhipu AI CEO, 2026년 6월 13일
이 선언은 단순한 마케팅이 아닌, 실제 행동으로 뒷받침됐습니다. GLM 시리즈는 꾸준히 MIT 라이선스로 공개돼 왔고, GLM 5.2 역시 출시 다음 주 오픈소스로 공개될 예정임을 약속했습니다.
GLM 모델 패밀리의 역사와 진화
GLM 5.2를 제대로 이해하려면, 이 모델이 어떤 여정을 거쳐 왔는지 알아야 합니다. 2026년은 Z.ai에게 '폭풍 성장'의 해였습니다. 단 4개월 만에 GLM-5 라인업의 주력 모델을 4번이나 출시하는 경이로운 속도를 보여줬습니다.
이 타임라인에서 눈에 띄는 것은 속도 자체입니다. DeepSeek, Qwen, Kimi 등 중국 AI 연구소들이 일제히 빠른 업데이트 사이클을 밟고 있는 지금, GLM도 그 경쟁에 뒤지지 않습니다. 테크 분석가 @teortaxesTex는 X에 이렇게 썼습니다: "GLM과 Kimi는 이미 세 번째 플래그십 이터레이션에 들어갔다. 그들도 빠른 업데이트 사이클에 합류했다."
핵심 포인트: MoE 아키텍처의 강점
GLM 시리즈가 채택한 Mixture-of-Experts(MoE) 아키텍처는 744B의 총 파라미터 중 토큰당 40B만 활성화합니다. 이는 추론 비용을 극적으로 줄이면서도 대형 밀집 모델 수준의 성능을 내는 핵심 기술입니다. DeepSeek가 이 방식으로 전 세계를 놀라게 했고, GLM도 같은 길을 걸어가고 있습니다.
GLM 5.2 핵심 스펙 완전 분석
GLM 5.2의 공식 발표는 간결했지만, 그 안에 담긴 내용은 결코 간단하지 않습니다. 하나씩 뜯어보겠습니다.
| 항목 | GLM 5.2 NEW | GLM 5.1 | GLM 5 |
|---|---|---|---|
| 출시일 | 2026년 6월 13일 | 2026년 4월 7일 | 2026년 2월 11일 |
| 컨텍스트 윈도우 | 1,000,000 토큰 | ~200,000 토큰 | 200,000 토큰 |
| 최대 출력 토큰 | 131,072 | 미공개 | 128,000 |
| 추론 모드 | High, Max (2단계) | 단일 모드 | 단일 모드 |
| 아키텍처 | 744B MoE (미확인) | 744B MoE, 40B 활성 | 744B MoE, 40B 활성 |
| 라이선스 | MIT (가중치 다음 주) | MIT (공개완료) | MIT (공개완료) |
| 출시 벤치마크 | 미공개 | SWE-Bench Pro 45.3 | SWE-Bench 77.8% |
| 접근 방법 | GLM Coding Plan 전 티어 | Coding Plan, API, 가중치 | API, 가중치 |
| 모델 ID | glm-5.2 / glm-5.2[1m] | glm-5.1 | glm-5 |
두 가지 추론 모드: High vs Max
GLM 5.2의 가장 주목할 기능 중 하나는 2단계 추론 노력(Thinking-Effort) 모드입니다. High와 Max — 얼핏 단순해 보이지만, 이 선택이 작업의 품질과 속도를 크게 좌우합니다.
| 구분 | High 모드 | Max 모드 ⭐ 권장 |
|---|---|---|
| 사용 목적 | 중간 복잡도의 코딩 작업 | 복잡한 멀티스텝 코딩 작업 |
| 특징 | 빠른 응답, 적당한 추론 깊이 | 느리지만 심층적, 신뢰성 높음 |
| Claude Code 매핑 | /effort xhigh | /effort max, ultracode |
| Z.ai 권장 여부 | 일반 작업 | 코딩 작업 전반 ✓ |
Z.ai는 코딩 작업이라면 무조건 Max 모드를 기본으로 사용하라고 권장합니다. 단, 커뮤니티에서는 이미 "간단한 작업에도 과도하게 생각한다(excessive thinking)"는 비판이 나오고 있어, 상황에 따른 조절이 필요합니다. 이에 대해서는 커뮤니티 반응 섹션에서 더 자세히 다루겠습니다.
1M 토큰 컨텍스트 윈도우가 실제로 의미하는 것 🧠
숫자만 보면 피부에 와닿지 않습니다. "100만 토큰이 도대체 얼마나 많은 거야?" 이런 의문이 드는 게 당연합니다. 실제 상황에 대입해 봅시다.
| 무엇을 담을 수 있나? | 약 몇 토큰? | GLM 5.2에서 가능? |
|---|---|---|
| 소설 한 권 (25만 단어) | ~333K 토큰 | ✅ 3권 동시 처리 가능 |
| 중형 Python 프로젝트 (40개 파일) | ~150K~400K 토큰 | ✅ 전체 레포 한 번에 로드 |
| 대용량 코드베이스 + 테스트 + 설정 | ~700K~900K 토큰 | ✅ 교차 파일 의존성 추적 |
| GPT-5 수준 프로젝트 규모 | ~1M 토큰 | ✅ 한계치 도달 가능 |
| GLM 5.1 최대 한도 | 200K 토큰 | ❌ 이를 초과하면 컨텍스트 손실 |
기존 GLM 5.1의 200K 컨텍스트도 결코 적은 양이 아니었습니다. 하지만 중형 규모의 실제 프로젝트에서는 종종 컨텍스트 한계에 부딪혔고, 에이전트가 계속해서 오래된 정보를 요약하거나 코드를 다시 가져오는 비효율이 발생했습니다. GLM 5.2의 1M 컨텍스트는 이 문제를 사실상 해소합니다.
컨텍스트 윈도우 비교 시각화
1M 컨텍스트 윈도우를 실제로 활용하는 주요 시나리오는 다음과 같습니다.
- 전체 레포지토리 리팩토링: 중형 Python 데이터 파이프라인(40개 파일)을 단일 세션에 로드하고, 교차 파일 의존성을 재요청 없이 추적하며 일관성 있게 리팩토링.
- 장기 에이전트 실행(Long-Horizon Agent Runs): GLM 5.1은 단일 세션에서 1,700+ 에이전트 스텝, 최대 8시간 자율 루프를 달성했습니다. GLM 5.2는 이 능력을 더 큰 컨텍스트와 함께 이어받습니다.
- 대용량 문서 분석: 200K 토큰을 초과하는 사양서, 로그, 트랜스크립트를 한 번에 처리. 소형 모델이 잘라내야 했던 내용을 온전히 보존.
- PR 규모 코드 검토: 전체 풀 리퀘스트 diff와 긴 에이전트 플랜-실행 트레이스를 131K 출력 토큰 한도 안에서 처리.
GLM 코딩 플랜 가격 체계 💰
GLM 5.2를 사용하는 방법은 현재 GLM Coding Plan 구독입니다. 출시 당시 기준으로, 독립 API와 가중치(Weights)는 다음 주에 공개 예정이었습니다. 가격 구조를 보면, 기존 구독자라면 추가 비용 없이 바로 GLM 5.2를 사용할 수 있다는 점이 특히 매력적입니다.
- ✓ 주 약 400회 프롬프트
- ✓ GLM 5.2 즉시 사용 가능
- ✓ 1M 컨텍스트 윈도우 포함
- ✓ Claude Code 연동 지원
- ✓ 개인 개발자 입문에 적합
프로모션 기간에는 월 $3~$10 수준으로 제공된 적도 있습니다. 일반적인 개인 개발자에게 가장 현실적인 시작점입니다.
- ✓ 주 약 2,000회 프롬프트
- ✓ GLM 5.2 즉시 사용 가능
- ✓ 1M 컨텍스트 윈도우 포함
- ✓ 모든 에이전트 도구 지원
- ✓ 활발한 프리랜서/스타트업에 적합
커뮤니티에서 "Claude Max 사용량의 3배를 월 30달러에" 라는 평가를 받을 만큼 가성비가 뛰어난 플랜입니다.
- ✓ 주 약 8,000회 프롬프트
- ✓ GLM 5.2 즉시 사용 가능
- ✓ 1M 컨텍스트 윈도우 포함
- ✓ 집중 코딩 세션에 최적
- ✓ 대형 프로젝트 에이전트 자동화
하루 수십~수백 회 프롬프트를 사용하는 헤비 유저에게 적합합니다. 8시간짜리 에이전트 루프 작업을 돌리는 개발자들이 주로 선택합니다.
- ✓ 팀 단위 좌석 기반 요금
- ✓ GLM 5.2 즉시 사용 가능
- ✓ 기업 수준 관리 기능
- ✓ 우선 지원 및 SLA
- ✓ 5인 이상 개발팀에 권장
조직 수준의 AI 코딩 환경이 필요한 기업을 위한 플랜. Z.ai 영업팀에 문의해 맞춤 견적을 받으세요.
참고로, API 단가는 GLM-5 기준으로 입력 $1.00/M 토큰, 출력 $3.20/M 토큰 수준이었습니다. GLM 5.2의 독립 API가 출시되면 가격이 변동될 수 있습니다. Claude Opus 4.6 대비 약 5배 저렴한 수준으로 유지될 것으로 예상됩니다.
- GLM 5.1이 SWE-Bench에서 Claude Opus 4.6의 94.6% 수준을 약 1/5 가격에 제공했다는 점을 고려하면, GLM 5.2는 "좋은 선택"을 넘어 "전략적 선택"이 될 수 있습니다.
- 단, 정밀한 창의적 작업이나 최고 수준의 추론이 필요한 경우에는 여전히 Claude Opus 4.8 등 최정상급 모델이 우위를 점합니다.
- 현재 GLM 5.2에는 벤치마크가 없어 5.1 대비 성능 향상폭을 정량적으로 검증하기 어렵습니다. 직접 시험 후 결정하세요.
Claude Code에 GLM 5.2 연동하는 법 🔧
GLM 5.2의 가장 강력한 기능 중 하나는 Anthropic 호환 API 엔드포인트입니다. 이는 환경 변수 하나만 바꾸면 Claude Code 사용자가 즉시 GLM 5.2로 전환할 수 있다는 의미입니다. 기존 워크플로우를 전혀 바꾸지 않아도 됩니다.
~/.claude/settings.json 파일을 열어 아래 내용을 추가하세요. Sonnet과 Opus 슬롯을 모두 glm-5.2[1m]으로 지정하고, auto-compact 윈도우를 100만으로 확장하는 것이 포인트입니다.// ~/.claude/settings.json
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your-zai-api-key",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
}
}
claude 명령어로 세션을 시작하세요.export ANTHROPIC_AUTH_TOKEN="your-zai-api-key"
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="glm-4.5-air"
claude
/effort max를 실행해 Max 추론 모드를 활성화하세요. /status 명령어로 현재 GLM 5.2가 정상 작동 중인지 확인합니다.# Claude Code 세션 내에서 실행
/effort max # Max 추론 모드 활성화 (코딩 작업 권장)
/status # 현재 모델 및 설정 확인
X 사용자 @konfuai는 이 설정의 의미를 정확히 짚었습니다: "GLM 5.2는 Anthropic 호환 API 엔드포인트를 탑재했습니다. Claude Code에서 환경 변수 하나만 바꾸면 전체 워크플로우를 유지할 수 있어요. Zhipu는 단순히 모델을 오픈소스로 만드는 게 아니라, 서방 API에서의 마찰 없는 이탈 경로를 만들고 있는 겁니다."
Cline, OpenCode 등 다른 도구 설정법
GLM 5.2는 출시 첫날부터 8개의 에이전트 코딩 도구와 호환됩니다. 자신이 사용하는 도구에 맞는 설정을 선택하세요.
호환 도구 목록
Cline 설정
Cline에서 GLM 5.2를 사용하려면 "OpenAI Compatible" 공급자를 선택하고 아래 설정을 입력하세요.
// Cline 설정
{
"provider": "OpenAI Compatible",
"baseURL": "https://api.z.ai/api/coding/paas/v4",
"model": "glm-5.2",
"contextWindow": 1000000,
"apiKey": "your-zai-api-key"
}
OpenClaw 설정
# OpenClaw 환경 변수
export OPENAI_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export OPENAI_API_KEY="your-zai-api-key"
export OPENAI_MODEL="glm-5.2[1m]"
다른 도구들도 대부분 OpenAI 호환 방식으로 동일하게 설정할 수 있습니다. Base URL을 https://api.z.ai/api/coding/paas/v4로, 모델을 glm-5.2 또는 glm-5.2[1m]으로 설정하면 됩니다.
커뮤니티 반응: 찬사와 비판 모두 📢
GLM 5.2 출시 공지는 Digg, X, Reddit을 중심으로 빠르게 퍼져나갔습니다. 커뮤니티의 반응은 극명하게 갈렸습니다.
X (구 트위터) 전반 감정 분석
총 414개 댓글 분석 기준 (Digg 센티먼트 집계)
커뮤니티에서 나온 주요 비판 사항
GLM 5.2에 대한 비판은 크게 세 가지로 요약됩니다.
- 단순 작업에 과도한 추론: 몇몇 사용자들이 간단한 질문에도 모델이 지나치게 오래 생각한다고 보고했습니다. "쓸 수가 없다"는 표현까지 나왔습니다.
- 선공개-후증명 방식: 벤치마크 없이 먼저 배포하고 성능 데이터는 나중에 제공하겠다는 전략에 대한 의구심. Z.ai는 의도적으로 실제 사용자의 손에 먼저 쥐어주는 방식을 택했습니다.
- 로컬 실행 장벽: 1M 컨텍스트를 로컬에서 돌리려면 수십 GB의 VRAM이 필요해, 오픈소스라는 이름이 무색하다는 지적이 있습니다.
벤치마크 부재의 이유와 실제 성능 📊
GLM 5.2 출시에서 가장 이례적인 부분은 단 하나의 벤치마크 점수도 공개되지 않았다는 점입니다. SWE-Bench Verified, LiveCodeBench, HumanEval — 어느 것도 없습니다. 이건 마치 스펙을 공개하지 않고 차를 파는 것과 비슷해 보입니다.
그러나 Z.ai의 의도를 분석해보면, 이는 전략적 선택입니다. 이 출시는 기존 GLM Coding Plan 구독자를 위한 것입니다. 이미 모델을 쓰고 있는 개발자들은 "환경 변수 하나 바꾸고 바로 시험해봐라"는 메시지를 받았습니다. 증거보다 접근이 먼저입니다. 벤치마크와 가중치는 그 다음 주에 공개될 예정이었습니다.
그렇다면 성능을 어떻게 가늠할 수 있을까요? 전작 GLM 5.1의 실적을 통해 추론해볼 수 있습니다.
| 벤치마크 | GLM 5.1 | Claude Opus 4.6 | 비고 |
|---|---|---|---|
| SWE-Bench Pro (코딩 평가) | 45.3 | 47.9 | GLM이 Opus의 94.6% 수준 |
| GLM-5 SWE-Bench Verified | — | — | GLM-5: 77.8% |
| GLM-5 BrowseComp | — | — | GLM-5: 75.9% |
| GLM-5 GPQA Diamond | — | — | GLM-5: 82.0% |
GLM 5.1이 전 세대 GLM-5 대비 28% 향상을 보였다는 점을 감안하면, GLM 5.2는 추가적인 향상이 기대됩니다. 특히 1M 컨텍스트가 필요한 대규모 레포지토리 작업에서는 성능 격차가 더 좁혀질 것으로 예상됩니다. 일부 커뮤니티 사용자들은 "GLM 5.2가 DeepSeek V4 Preview와 경쟁할 것"이라는 예측도 내놨습니다.
- 이 글을 쓰는 시점에서 GLM 5.2의 독립 벤치마크는 존재하지 않습니다. "강력한 코딩 능력"은 Z.ai의 자체 주장입니다.
- 성능 검증은 커뮤니티와 독립 연구자들이 진행 중이며, 오픈소스 가중치가 공개된 후 더 명확해질 것입니다.
- 직접 Coding Plan을 구독하고 본인의 프로젝트로 테스트해보는 것이 가장 정직한 방법입니다.
GLM 5.2를 써야 하는 사람 vs 아닌 사람
| 유형 | GLM 5.2 적합도 | 이유 |
|---|---|---|
| Claude Code 구독자 / 비용 절감 원하는 개발자 | ⭐⭐⭐⭐⭐ | API 호환성 완벽, 유사 성능, 5배 저렴한 비용 |
| 대형 레포지토리 리팩토링 필요한 팀 | ⭐⭐⭐⭐⭐ | 1M 컨텍스트로 전체 코드베이스 처리 가능 |
| 오픈소스 선호자 / 국산 AI 배제 필요 환경 | ⭐⭐⭐⭐⭐ | MIT 오픈소스, 자체 호스팅 가능 (가중치 공개 후) |
| 장기 에이전트 자동화 워크플로우 구축자 | ⭐⭐⭐⭐ | 8시간 이상 자율 루프 경험 있는 GLM 라인업 |
| 최고 수준의 창의적·분석적 작업 필요한 경우 | ⭐⭐ | Claude Opus 4.8, GPT-5.5 등 최정상급이 여전히 앞설 수 있음 |
| 간단한 일상 질문이 주력인 사용자 | ⭐⭐ | 단순 작업의 과도한 추론으로 속도 저하 가능 |
| 중국 AI 서비스 사용에 보안/정책 제약이 있는 기업 | ⭐ | 데이터 처리 정책, 컴플라이언스 검토 필요 |
오픈소스 AI 전쟁, 앞으로의 전망 🌍
GLM 5.2의 출시는 단독 이벤트가 아닙니다. 같은 주에 Minimax M3와 Kimi 2.7 Code도 출시됐습니다. AI 커뮤니티에서는 "오픈소스가 역대 최고의 한 주"라고 표현할 만큼 중국발 오픈소스 모델들의 동시 다발적 릴리스가 이루어진 특별한 시기였습니다.
이 흐름의 배경에는 지정학적 긴장이 있습니다. 일부 서방 프런티어 모델들의 접근이 비기술적 이유로 제한되기 시작한 2026년 초, 중국 AI 기업들은 역설적으로 "우리는 더 열린다"는 전략으로 대응했습니다. Z.ai의 선언은 이를 명확히 보여줍니다.
앞으로의 경쟁 구도는 다음과 같이 전개될 것으로 예상됩니다.
- 단기 (1~3개월): GLM 5.2 오픈소스 가중치 공개 후 커뮤니티의 독립 벤치마크와 파인튜닝이 활발해질 것. Hugging Face, Together.ai 등에서 저렴한 API 접근도 가능해질 전망.
- 중기 (3~6개월): GLM 5.3 또는 다음 버전 출시 예상. 현재의 빠른 업데이트 사이클(2개월 주기)이 유지된다면 8월경 새 버전이 나올 수 있음.
- 장기: 1M 이상의 컨텍스트 경쟁이 본격화. Gemini, Claude 등 서방 모델들과 컨텍스트 윈도우, 에이전트 능력, 오픈소스 가용성에서 치열한 경쟁 예상.
마무리: 선택의 자유 🗝️
GLM 5.2는 완벽한 모델이 아닙니다. 벤치마크도 없고, 로컬 실행은 여전히 어렵고, 간단한 작업에 과도하게 추론하는 문제도 있습니다. 하지만 이 모델이 던지는 메시지는 명확합니다: "프런티어 AI 인텔리전스는 특권이 아니라 모두의 것이 되어야 한다."
100만 토큰 컨텍스트, Anthropic 호환 API, MIT 오픈소스 — 이 세 가지 조합은 많은 개발자에게 실질적인 대안을 제시합니다. Claude Opus의 성능 대부분을 1/5 가격에 제공하겠다는 GLM 시리즈의 방향성은, 앞으로도 우리가 계속 주목해야 할 이유가 됩니다.
여러분은 어떻게 생각하시나요? GLM 5.2의 1M 컨텍스트가 여러분의 개발 워크플로우에 실질적인 변화를 가져올까요? 직접 써보신 분들의 경험을 댓글로 나눠주세요. 😊
- 출시일: 2026년 6월 13일 / 개발사: Z.ai (Zhipu AI)
- 컨텍스트: 1,000,000 토큰 (모델 ID: glm-5.2[1m])
- 최대 출력: 131,072 토큰
- 추론 모드: High / Max (코딩은 Max 권장)
- 호환 도구: Claude Code, Cline, OpenCode, Roo Code, Goose, Crush, OpenClaw, Kilo Code
- API 엔드포인트: Anthropic 호환 (base URL 스왑만으로 전환)
- 가격: Lite ~$18/월 (주 400회) · Pro ~$30/월 (주 2,000회) · Max ~$80/월 (주 8,000회)
- 오픈소스: MIT 라이선스 가중치 (출시 후 1주일 내 공개 예정)
- 벤치마크: 출시 당시 미공개 — 직접 테스트 권장