

Trinity Large Thinking
#36 in Reasoning-Modellearcee · large thinking · seit 2026-04-01 · 12× · zuletzt 30. Juni 2026
Trinity-Large-Thinking ist ein von Arcee AI entwickeltes, quelloffenes Reasoning-Sprachmodell mit 398 Milliarden Parametern in einer Sparse-Mixture-of-Experts-Architektur, von denen pro Token nur rund 13 Milliarden aktiv sind. Das Modell generiert vor der finalen Antwort explizite Denkschritte (Chain-of-Thought) in <think>-Blöcken und ist speziell für mehrstufige Agenten-Workflows, Tool-Aufrufe und lange Kontexte optimiert. Es wird unter der Apache-2.0-Lizenz mit offenen Gewichten auf Hugging Face sowie über die Arcee-API und OpenRouter bereitgestellt.</description> <description_en">Trinity-Large-Thinking is an open-weight reasoning language model developed by Arcee AI, featuring 398 billion parameters in a sparse Mixture-of-Experts architecture, of which only about 13 billion are active p
Features
| Key-Benchmark (%) | τ²-Bench: 94,7 % | PinchBench: 91,9 % (#2 hinter Claude Opus 4.6) | LiveCodeBench: 98,2 % | SWE-bench Verified: 63,2 % | MMLU-Pro: 83,4 % (alle Werte laut offizieller Arcee-Dokumentation) |
| Kontextfenster (Token) | 262.144 Token (via API/OpenRouter); laut offizieller Doku auch 512K Token für Extended-Context-Agentic-Loops erwähnt |
| Lizenz | Ursprünglich Apache 2.0 (zum Launch); nachträglich auf OpenMDW-1.1 (Linux Foundation, permissiv, für KI-Modell-Distributionen) umgestellt – keine Nutzungsbeschränkungen, kommerzielle Nutzung erlaubt |
| Multimodalität | Nur Text (text-only); keine Bild- oder Audiomodalität |
| Plattform | Arcee AI API, OpenRouter, Hugging Face (Open Weights, 797 GB); Self-Hosting via vLLM, SGLang, llama.cpp, LM Studio, Transformers; Cloud-Deploy auf AWS, GCP, Azure, On-Prem |
| Preis | Gewichte kostenlos auf Hugging Face (Open Weights); API-Nutzung: $0,25/1M Input, $0,80/1M Output (Arcee-Plattform, laut offizieller Preisseite) |
| Preis pro 1M Token | Arcee API (offiziell): $0,25 / 1M Input-Token, $0,80 / 1M Output-Token; OpenRouter: $0,25 Input / $0,80 Output |
| Release-Datum | 1. April 2026 |