

Phi-3
#9 in Small & Edge-Modellemicrosoft · v3 · seit 2024-04-23 · 10× · zuletzt 30. Juni 2026
Phi-3 ist eine Familie offener kleiner Sprachmodelle (Small Language Models, SLM) von Microsoft, bestehend aus Phi-3-mini (3,8 Mrd. Parameter), Phi-3-small (7 Mrd.), Phi-3-medium (14 Mrd.) und dem multimodalen Phi-3-vision (4,2 Mrd.). Die Modelle wurden speziell auf hochwertige, kuratierte Trainingsdaten statt reiner Datenmenge ausgelegt, um trotz geringer Parameterzahl eine im Vergleich zu größeren Modellen (z.B. GPT-3.5, Mixtral 8x7B) konkurrenzfähige Leistung bei Sprache, Logik, Mathematik und Code zu erzielen. Phi-3-mini ist in Kontextlängen-Varianten mit 4K und 128K Token verfügbar und für ressourcenbeschränkte, latenzkritische oder On-Device-Einsatzszenarien konzipiert. Die Modelle sind unter MIT-Lizenz offen verfügbar über Azure AI Foundry, Hugging Face, Ollama und als ONNX/NVIDIA-N
Features
| Key-Benchmark (%) | MMLU (5-Shot): Phi-3-mini 68,8%; Phi-3-small 75,7%; Phi-3-medium 78,0% |
| Kontextfenster (Token) | 4K oder 128K Token (mini); Small: 8K/128K; Medium: 4K/128K |
| Lizenz | MIT License (offene Gewichte) |
| Multimodalität | Text (mini/small/medium); Phi-3-vision (4,2B) zusätzlich Bild+Text |
| Plattform | Azure AI Foundry/Studio, Hugging Face, Ollama, ONNX Runtime, NVIDIA NIM |
| Release-Datum | 23. April 2024 (Phi-3-mini); Phi-3-small/medium/vision: 21. Mai 2024 |