

Nemotron
#38nvidia · seit Nemotron 3 Nano: 14. Dez. 2025; Nemotron 3 Super: 11. März 2026; Nemotron 3 Ultra: 4. Juni 2026 · 24× · zuletzt 01. Juli 2026
NVIDIA Nemotron ist eine Familie offener Sprachmodelle für agentische KI-Anwendungen, bestehend aus den Größen Nano, Super und Ultra. Das aktuelle Flaggschiff "Nemotron 3 Ultra" ist ein Mixture-of-Experts-Modell mit 550 Milliarden Gesamt- und 55 Milliarden aktiven Parametern, das eine hybride Mamba-Transformer-Architektur nutzt und für komplexe, lang laufende Agenten-Workflows mit hohem Durchsatz optimiert ist. Die Modelle werden mit offenen Gewichten, Trainingsdaten und Trainingsrezepten unter der NVIDIA-eigenen offenen Lizenz veröffentlicht und sind über Hugging Face, NVIDIA NIM sowie Drittanbieter-APIs verfügbar. Laut unabhängigen Benchmarks (Artificial Analysis) erreicht Nemotron 3 Ultra den höchsten Intelligence-Index-Wert aller US-amerikanischen offenen Modelle, liegt aber hinter ein
Features
| Key-Benchmark (%) | Super: SWE-Bench Verified 60,47 % | Ultra (550B): Artificial Analysis Intelligence Index 48 (höchster US-Open-Weight-Score) | Nano: AIME 2025 (with tools) 99,2 % |
| Kontextfenster (Token) | Nano & Super: 1.000.000 Token | Ultra (550B): 1.000.000 Token | Nano Omni: 300.000 Token |
| Lizenz | NVIDIA Nemotron Open Model License (permissiv: kommerziell nutzbar, Derivative Works erlaubt, keine Attribution-Pflicht) |
| Multimodalität | Nemotron 3 Nano Omni: Text, Bild, Video, Audio (Input) → Text (Output); Standard-Textmodelle (Nano/Super/Ultra): nur Text |
| Plattform | build.nvidia.com (NIM-Microservices), Hugging Face, OpenRouter, Perplexity; Deployment via vLLM, SGLang, Ollama, llama.cpp; Hardware: NVIDIA Ampere/Hopper/Blackwell GPUs |
| Preis pro 1M Token | Nano 30B: ab $0,05 Input / $0,20 Output | Super 120B: ab $0,10 Input / $0,50 Output | Ultra 253B (Llama): $2,00 Input / $6,00 Output (via NVIDIA NIM API); NIM-Hosted-Tier kostenlos (Prototyping, ~40 RPM) |
| Release-Datum | Nano: 14. Dez. 2025 | Super: 11. März 2026 (GTC) | Ultra: 4. Juni 2026 (Computex) |