

MiniMax-M3
#2minimax · seit 2026-06-01 · 52× · zuletzt 01. Juli 2026
MiniMax-M3 ist ein quelloffenes (Open-Weight) multimodales Sprachmodell von MiniMax, das am 1. Juni 2026 veröffentlicht wurde. Es basiert auf einer Mixture-of-Experts-Architektur mit ~428 Mrd. Gesamtparametern und ~23 Mrd. aktiven Parametern pro Forward-Pass. Als zentrales architektonisches Merkmal ersetzt die hauseigene MiniMax Sparse Attention (MSA) die klassische quadratische Attention, was ein Kontextfenster von bis zu 1 Million Tokens bei stark reduziertem Rechenaufwand ermöglicht. M3 ist das erste Open-Weight-Modell, das frontier-level Coding, ein 1-Million-Token-Kontextfenster und native Multimodalität (Text, Bild, Video) gleichzeitig vereint.
Features
| Kontextfenster (Token) | Bis zu 1.048.576 Token (1M); garantiertes Minimum 512.000 Token. Output-Limit: bis zu 512.000 Token. Eingaben >512K Token werden zu einem höheren Tarif abgerechnet. |
| Lizenz | MiniMax Community License (kein Standard-Open-Source wie Apache 2.0 oder MIT; kommerzielle Nutzung erfordert gesonderte Prüfung der Lizenzbedingungen) |
| Plattform | MiniMax API (platform.minimax.io), MiniMax Code (Agent-Produkt), OpenRouter, ModelScope; Self-Hosting via SGLang, vLLM, Transformers, KTransformers (Hugging Face: MiniMaxAI/MiniMax-M3) |
| Preis | Pay-as-you-go: ab $0,30/M Input-Token. Token-Plan-Abonnements: Plus $20/Monat (~1,7 Mrd. Token), Max $50/Monat (~5,1 Mrd. Token), Ultra $120/Monat (~9,8 Mrd. Token). |
| Release-Datum | 1. Juni 2026 (API-Launch); Weights auf Hugging Face ab 7. Juni 2026 |