

Qwen-Image
#16alibaba · seit 2025-08-05 · 5× · zuletzt 29. Juni 2026
22
Momentum
Qwen-Image ist ein 20-Milliarden-Parameter-Bildgenerierungsmodell (MMDiT-Architektur) von Alibabas Tongyi-Qianwen-Team, das im August 2025 als Open-Source (Apache 2.0) veröffentlicht wurde. Es wurde speziell für hochwertiges Text-Rendering in mehreren Sprachen (insbesondere Chinesisch und Englisch) entwickelt und erreichte bei der Veröffentlichung in 9 öffentlichen Benchmarks jeweils Platz 1. Das Modell kann sowohl Text-zu-Bild-Generierung als auch präzises Bild-Editing ausführen. Mit Qwen-Image-2.0 (Februar 2026) folgte ein Nachfolger mit 7B Parametern und nativer 2K-Auflösung.
Momentum-Verlauf
04.04.03.07.
Features
| Speicherbedarf (GB) | ~61,8 GB VRAM bei FP16-Präzision (1024×1024); Modelldateigröße ~57 GB (BF16); mit DFloat11-Quantisierung + CPU-Offloading auf einer RTX 3090 deploybar; FP8-Download ~26,7 GB |