

Flux.2 Klein
#20black-forest-labs · seit 2026-01-15 · 5× · zuletzt 30. Juni 2026
19
Momentum
FLUX.2 [klein] 4B ist ein destilliertes Text-zu-Bild- und Bildbearbeitungsmodell von Black Forest Labs mit 4 Milliarden Parametern, das auf einem Rectified-Flow-Transformer basiert. Es vereint Text-zu-Bild-Generierung, Einzelreferenz-Bildbearbeitung und Multi-Referenz-Komposition in einer einzigen kompakten Architektur und erreicht dabei eine End-to-End-Inferenzzeit von unter einer Sekunde. Das Modell ist auf Consumer-GPUs (ab RTX 3090/4070) lauffähig und wird vollständig unter der Apache-2.0-Lizenz veröffentlicht. Es ist auf 4 Inferenzschritte step-destilliert und nutzt einen Qwen3-basierten Text-Encoder.
Momentum-Verlauf
04.04.03.07.
Features
| API-Verfügbarkeit | Ja – offizielle BFL-REST-API (flux-2-klein-4b); zusätzlich verfügbar via Replicate, OpenRouter, fal.ai, Segmind, NVIDIA Build u. a. |
| Benchmark-Score (Text-zu-Bild) | Durchschnittlicher CLIP-Score: 0,335 (Benchmark auf H100, 10 Kategorien); Elo-basierte Evaluierung durch BFL zeigt Pareto-Frontier bei Qualität vs. Latenz/VRAM gegenüber Qwen- und Z-Image-Modellen |
| Bildauflösung (Max.) | Bis zu 4 Megapixel (z. B. 2048×2048); Mindestauflösung 64×64; Dimensionen müssen Vielfache von 16 sein |
| Feinabstimmung (Fine-tuning) | Nur über die Base-Variante (FLUX.2-klein-base-4B): undestilliert, für LoRA-Training und Fine-tuning vorgesehen; die distillierte 4B-Variante ist nicht für Fine-tuning ausgelegt |
| Generierungsgeschwindigkeit | Distilled: ~1,2 s auf RTX 5090 (ComfyUI); 0,57 s auf H100 bei 1024×1024 (4 Schritte); sub-sekündlich auf moderner Hardware laut BFL |
| Preis-Tier | API: ab $0,014 pro Bild (1 MP, BFL-API); jedes weitere Megapixel +$0,001; lokal kostenlos unter Apache 2.0 |
| Speicherbedarf (GB) | ~13 GB VRAM (BF16, offiziell); FP8-Quantisierung reduziert auf ~6–8 GB; NVFP4 bis zu 55 % VRAM-Reduktion gegenüber BF16 |