

GLM-5.2
#25zhipu-ai · v5.2 · seit 2026-06-13 (GLM Coding Plan); Weights & API: 2026-06-16/17 · 11× · zuletzt 01. Juli 2026
GLM-5.2 ist ein Open-Weight-Sprachmodell von Zhipu AI (Marke: Z.ai), das am 13. Juni 2026 zunächst für GLM-Coding-Plan-Abonnenten erschien und ab 16./17. Juni 2026 mit MIT-lizenzierten Gewichten auf Hugging Face sowie einem eigenständigen API öffentlich verfügbar ist. Es basiert auf einer Mixture-of-Experts-Architektur mit 753 Milliarden Gesamtparametern (~40 Mrd. aktiv) und einem 1-Millionen-Token-Kontextfenster, das durch die neue IndexShare-Sparse-Attention-Technik kosteneffizient gehalten wird. Das Modell ist primär für langfristige autonome Coding-Aufgaben und agentische Workflows ausgelegt und gilt laut unabhängigen Leaderboards als stärkstes Open-Weight-Modell auf SWE-bench Pro und Terminal-Bench 2.1. Die Inferenzkosten via Z.ai-API betragen $1.40/1M Input-Token und $4.40/1M Output-
Features
| Key-Benchmark (%) | SWE-bench Pro: 62,1 % | Terminal-Bench 2.1: 81,0 % | GPQA Diamond: 91,2 % | Artificial Analysis Intelligence Index v4.1: 51 (Rang 6 open-weight) |
| Kontextfenster (Token) | 1.000.000 Token (1.048.576); max. Output: 131.072 Token (API); MoE 753B total / ~40B aktiv |
| Lizenz | MIT (Open Weights, kommerzielle Nutzung, Fine-Tuning und Self-Hosting erlaubt) |
| Multimodalität | Primär Text; Vision-Input (Bild) unterstützt laut Requesty/API-Karte; Tool-Calling, Reasoning (High/Max), Structured Output |
| Plattform | Z.ai (zhipuai.cn) API; Hugging Face (zai-org/GLM-5.2); OpenRouter; Cloudflare Workers AI; ModelScope; self-hosting via vLLM, SGLang, KTransformers, Ollama |
| Preis pro 1M Token | $1,40 Input / $4,40 Output (Z.ai API); Cache-Input: $0,26; GLM Coding Plan Subscription: ab $18/Monat |
| Release-Datum | 13. Juni 2026 (GLM Coding Plan); Weights + standalone API: 16./17. Juni 2026 |