Language

Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium

Flux.2 Klein

#20

black-forest-labs · seit 2026-01-15 · 5× · zuletzt 30. Juni 2026

Momentum

FLUX.2 [klein] 4B ist ein destilliertes Text-zu-Bild- und Bildbearbeitungsmodell von Black Forest Labs mit 4 Milliarden Parametern, das auf einem Rectified-Flow-Transformer basiert. Es vereint Text-zu-Bild-Generierung, Einzelreferenz-Bildbearbeitung und Multi-Referenz-Komposition in einer einzigen kompakten Architektur und erreicht dabei eine End-to-End-Inferenzzeit von unter einer Sekunde. Das Modell ist auf Consumer-GPUs (ab RTX 3090/4070) lauffähig und wird vollständig unter der Apache-2.0-Lizenz veröffentlicht. Es ist auf 4 Inferenzschritte step-destilliert und nutzt einen Qwen3-basierten Text-Encoder.

Momentum-Verlauf

04.04.03.07.

Features

API-Verfügbarkeit	Ja – offizielle BFL-REST-API (flux-2-klein-4b); zusätzlich verfügbar via Replicate, OpenRouter, fal.ai, Segmind, NVIDIA Build u. a.
Benchmark-Score (Text-zu-Bild)	Durchschnittlicher CLIP-Score: 0,335 (Benchmark auf H100, 10 Kategorien); Elo-basierte Evaluierung durch BFL zeigt Pareto-Frontier bei Qualität vs. Latenz/VRAM gegenüber Qwen- und Z-Image-Modellen
Bildauflösung (Max.)	Bis zu 4 Megapixel (z. B. 2048×2048); Mindestauflösung 64×64; Dimensionen müssen Vielfache von 16 sein
Feinabstimmung (Fine-tuning)	Nur über die Base-Variante (FLUX.2-klein-base-4B): undestilliert, für LoRA-Training und Fine-tuning vorgesehen; die distillierte 4B-Variante ist nicht für Fine-tuning ausgelegt
Generierungsgeschwindigkeit	Distilled: ~1,2 s auf RTX 5090 (ComfyUI); 0,57 s auf H100 bei 1024×1024 (4 Schritte); sub-sekündlich auf moderner Hardware laut BFL
Preis-Tier	API: ab $0,014 pro Bild (1 MP, BFL-API); jedes weitere Megapixel +$0,001; lokal kostenlos unter Apache 2.0
Speicherbedarf (GB)	~13 GB VRAM (BF16, offiziell); FP8-Quantisierung reduziert auf ~6–8 GB; NVFP4 bis zu 55 % VRAM-Reduktion gegenüber BF16

Flux.2 Klein

Features

Belege (5)

Subscribe free. Unsubscribe the second it sucks.