

Qwen-RobotWorld
#9alibaba · 2× · zuletzt 29. Juni 2026
34
Momentum
Qwen-RobotWorld ist ein language-conditioned Video-World-Modell von Alibaba, das natürliche Sprache als einheitliche Aktionsschnittstelle nutzt. Das Modell umfasst über 20 verschiedene Embodiments und über 500 Aktionskategorien und wurde mit einem Datensatz von 8,6 Millionen Video-Text-Paaren und über 200 Millionen Frames trainiert.
Momentum-Verlauf
04.04.03.07.
Features
| Multimodalität | Video + natürliche Sprache |