

Qwen 2
#28 in Open-Source-Sprachmodellealibaba · v2 · seit 2024-06-06 · 2× · zuletzt 29. Juni 2026
18
Momentum
Qwen 2 ist ein Sprachmodell von Alibaba, das in einer 1.5B-Variante verfügbar ist. Laut Tests erreichte das Modell eine Retrieval Accuracy von etwa 50.0%.
Momentum-Verlauf
04.04.03.07.
Features
| Benchmark-Score (MMLU/ähnlich) | Qwen2-72B (Base): 84,2 auf MMLU (5-shot); 37,9 auf GPQA; 64,6 auf HumanEval; 89,5 auf GSM8K. Qwen2-7B (Base): 70,3 auf MMLU. |
| Kontextfenster | 32.768 Tokens (Qwen2-1.5B Base); bis zu 128.000 Tokens bei Qwen2-7B-Instruct und Qwen2-72B-Instruct (mit YARN) |
| Modellgröße (Parameter) | 1,5 Milliarden Parameter (Qwen2-1.5B); Modellfamilie: 0,5B / 1,5B / 7B / 57B-A14B (MoE) / 72B |
| Preis-Tier | Open Source / kostenlos (Apache 2.0 für 0,5B, 1,5B, 7B, 57B-A14B); Qwen2-72B unter Qianwen-Lizenz (eigene kommerzielle Lizenz). Gewichte frei auf Hugging Face und ModelScope verfügbar. |
| Speicher-Anforderung | ~4,63 GB VRAM im float16/bfloat16-Format für Qwen2-1.5B (Gewichte); Qwen2-72B benötigt ~144 GB VRAM in BF16 |