Language

Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium

GLM-5.2

#25

zhipu-ai · v5.2 · seit 2026-06-13 (GLM Coding Plan); Weights & API: 2026-06-16/17 · 11× · zuletzt 01. Juli 2026

Momentum

GLM-5.2 ist ein Open-Weight-Sprachmodell von Zhipu AI (Marke: Z.ai), das am 13. Juni 2026 zunächst für GLM-Coding-Plan-Abonnenten erschien und ab 16./17. Juni 2026 mit MIT-lizenzierten Gewichten auf Hugging Face sowie einem eigenständigen API öffentlich verfügbar ist. Es basiert auf einer Mixture-of-Experts-Architektur mit 753 Milliarden Gesamtparametern (~40 Mrd. aktiv) und einem 1-Millionen-Token-Kontextfenster, das durch die neue IndexShare-Sparse-Attention-Technik kosteneffizient gehalten wird. Das Modell ist primär für langfristige autonome Coding-Aufgaben und agentische Workflows ausgelegt und gilt laut unabhängigen Leaderboards als stärkstes Open-Weight-Modell auf SWE-bench Pro und Terminal-Bench 2.1. Die Inferenzkosten via Z.ai-API betragen $1.40/1M Input-Token und $4.40/1M Output-

Momentum-Verlauf

04.04.03.07.

Features

Key-Benchmark (%)	SWE-bench Pro: 62,1 % \| Terminal-Bench 2.1: 81,0 % \| GPQA Diamond: 91,2 % \| Artificial Analysis Intelligence Index v4.1: 51 (Rang 6 open-weight)
Kontextfenster (Token)	1.000.000 Token (1.048.576); max. Output: 131.072 Token (API); MoE 753B total / ~40B aktiv
Lizenz	MIT (Open Weights, kommerzielle Nutzung, Fine-Tuning und Self-Hosting erlaubt)
Multimodalität	Primär Text; Vision-Input (Bild) unterstützt laut Requesty/API-Karte; Tool-Calling, Reasoning (High/Max), Structured Output
Plattform	Z.ai (zhipuai.cn) API; Hugging Face (zai-org/GLM-5.2); OpenRouter; Cloudflare Workers AI; ModelScope; self-hosting via vLLM, SGLang, KTransformers, Ollama
Preis pro 1M Token	$1,40 Input / $4,40 Output (Z.ai API); Cache-Input: $0,26; GLM Coding Plan Subscription: ab $18/Monat
Release-Datum	13. Juni 2026 (GLM Coding Plan); Weights + standalone API: 16./17. Juni 2026

GLM-5.2

Features

Belege (11)

Subscribe free. Unsubscribe the second it sucks.