

V4-Flash
#47deepseek · v4 · seit 24. April 2026 · 12× · zuletzt 30. Juni 2026
DeepSeek-V4-Flash ist ein am 24. April 2026 als Preview veröffentlichtes Mixture-of-Experts-Sprachmodell mit 284 Milliarden Gesamtparametern und 13 Milliarden aktivierten Parametern pro Token. Es ist die schnellere, kosteneffizientere Variante der V4-Serie neben dem größeren V4-Pro und nutzt eine Hybrid-Attention-Architektur (Compressed Sparse Attention + Heavily Compressed Attention) für effiziente Verarbeitung von bis zu 1 Million Token Kontext. Das Modell ist textbasiert (kein multimodaler Input), wird unter MIT-Lizenz mit offenen Gewichten auf Hugging Face bereitgestellt und über die DeepSeek-API sowie chat.deepseek.com angeboten.
Features
| Key-Benchmark (%) | SWE-bench Verified: 79,0%; LiveCodeBench: 91,6; GPQA Diamond: 88,1 |
| Kontextfenster (Token) | 1.048.576 Token (1M), max. 384K Output |
| Lizenz | MIT License (offene Gewichte) |
| Multimodalität | Nur Text (kein Bild-/Audio-Input) |
| Plattform | DeepSeek API (OpenAI- & Anthropic-kompatibel), chat.deepseek.com, Hugging Face (offene Gewichte) |
| Preis pro 1M Token | $0,14 Input (Cache-Miss) / $0,0028 Input (Cache-Hit) / $0,28 Output |
| Release-Datum | 24. April 2026 (Preview-Release) |