

Nemotron-Labs-Diffusion
#30nvidia · seit 2026-05-23 · 2× · zuletzt 30. Juni 2026
Nemotron-Labs-Diffusion ist eine Sprachmodellfamilie von NVIDIA (keine Text-zu-Bild-KI), die autoregressive (AR)-, Diffusions- und Self-Speculation-Dekodierung in einem einzigen Modell-Checkpoint vereint. Die Familie umfasst dichte Modelle mit 3B, 8B und 14B Parametern sowie eine Vision-Language-Variante (VLM-8B); die Modi werden zur Inferenzzeit durch bloßes Ändern des Attention-Musters gewechselt. Das Modell wurde auf 1,3 Billionen Tokens vortrainiert und anschließend mit 45 Milliarden Tokens supervised-fine-getuned. Veröffentlicht wurde es unter der NVIDIA Nemotron Open Model License, die kommerzielle Nutzung für die Textmodelle erlaubt.
Features
| Preis-Tier | Open-Weight-Modell unter NVIDIA Nemotron Open Model License (kommerziell nutzbar für Textmodelle); Gewichte kostenlos auf Hugging Face verfügbar. VLM-8B unter separater NVIDIA Source Code License. |