

Qwen2.5
#12alibaba · v2.5 · seit 2024-09-19 · 38× · zuletzt 30. Juni 2026
Qwen2.5 ist eine im September 2024 von Alibabas Qwen-Team veröffentlichte Familie offener, dichter Decoder-only Sprachmodelle mit Parametergrößen von 0,5B bis 72B. Die Modelle wurden auf bis zu 18 Billionen Token vortrainiert, unterstützen ein Kontextfenster von bis zu 128.000 Token und erzielen im Vergleich zum Vorgänger Qwen2 deutliche Verbesserungen bei Wissen (MMLU), Coding (HumanEval) und Mathematik (MATH). Die meisten Modellgrößen stehen unter Apache-2.0-Lizenz, während die Varianten 3B und 72B einer eigenen Qwen-Lizenz bzw. Qwen-Research-Lizenz unterliegen; über die Alibaba Cloud Model Studio API sind zudem kostenpflichtige Zugänge (z.B. für Qwen2.5-72B über Drittanbieter) verfügbar.</description> <description_en">Qwen2.5 is a family of open, dense decoder-only language models relea
Features
| Key-Benchmark (%) | Qwen2.5-72B-Instruct: MMLU 86,1 | MBPP 88,2 | GSM8K 95,8 | MT-Bench 93,5 | Arena-Hard 81,2 |
| Kontextfenster (Token) | 128K Tokens Input (131.072); Output bis 8K Tokens |
| Lizenz | Apache 2.0 (0,5B–32B); Qwen License (72B); Qwen Research License (3B) |
| Multimodalität | Basis-LLM (Qwen2.5): Text only. Multimodale Varianten: Qwen2.5-VL (Text+Bild/Video), Qwen2.5-Omni-7B (Text+Bild+Audio+Video → Text+Sprache) |
| Plattform | Hugging Face, GitHub, ModelScope, Ollama; API via Alibaba Cloud Model Studio (OpenAI-kompatibel); lokale Inferenz via vLLM, TensorRT-LLM |
| Preis | Open-Weight: kostenlos (self-hosted); API (Alibaba Cloud): ab ~$0,36/1M Input-Token (72B Instruct) via Alibaba API |
| Preis pro 1M Token | 72B Instruct: $0,36 Input / $0,40 Output (Alibaba API); 7B: ab $0,20/1M (Drittanbieter) |
| Release-Datum | 19. September 2024 |