

DeepSeek R1
#2deepseek · seit 2025-01-20 · 80× · zuletzt 30. Juni 2026
92
Momentum
DeepSeek R1 ist ein Open-Source-Reasoning-Modell von DeepSeek, das am 20. Januar 2025 veröffentlicht wurde. Es basiert auf einer Mixture-of-Experts-Architektur (MoE) mit 671 Milliarden Gesamtparametern, von denen bei jedem Inference-Pass nur rund 37 Milliarden aktiv sind. Das Modell setzt auf Reinforcement Learning (RL) mit Chain-of-Thought-Training und erreicht Benchmark-Leistungen vergleichbar mit OpenAI o1 in Mathematik, Code und Reasoning-Aufgaben. Es wird unter der MIT-Lizenz veröffentlicht und ist sowohl über die DeepSeek-API als auch als Open-Weight-Modell zur Selbst-Hosting verfügbar.
Momentum-Verlauf
04.04.03.07.
Features
| Key-Benchmark (%) | AIME 2024: 79,8 % (Pass@1) · MATH-500: 97,3 % (Pass@1) · MMLU: 90,8 % (Pass@1) — aus dem offiziellen technischen Paper (arxiv.org/abs/2501.12948). Update R1-0528 (Mai 2025): AIME 2025: 87,5 % |
| Kontextfenster (Token) | 128.000 Token (128K) – laut technischem Report und Modellkarte; aktualisierte Version R1-0528 ca. 130K Token |
| Lizenz | MIT License (Modellgewichte & API-Outputs; kommerzielle Nutzung, Modifikationen und Destillation erlaubt) |
| Multimodalität | Nein – DeepSeek R1 unterstützt ausschließlich Text-Input (kein Bild-, Audio- oder Video-Input). Für multimodale Aufgaben bietet DeepSeek eine separate Modellreihe (Janus-Serie). |
| Plattform | DeepSeek API (api.deepseek.com, model=deepseek-reasoner) · DeepSeek Chat (chat.deepseek.com) · Open-Source-Gewichte auf Hugging Face & GitHub (Self-Hosting via vLLM, llama.cpp, Ollama u.a.) |
| Preis | API (DeepSeek offiziell, zum Release): $0,14/1M Input-Token (Cache Hit) · $0,55/1M Input-Token (Cache Miss) · $2,19/1M Output-Token |
| Preis pro 1M Token | Input (Cache Miss): $0,55 · Input (Cache Hit): $0,14 · Output: $2,19 (offizielle DeepSeek API-Preise zum Launch; deepseek-reasoner alias) |
| Release-Datum | 20. Januar 2025 |