

Gemini Embedding 2
#1google · v2 · seit Public Preview: 10. März 2026; GA: 22. April 2026 · 24× · zuletzt 30. Juni 2026
100
Momentum
Gemini Embedding 2 ist Googles erstes nativ multimodales Embedding-Modell, das Text, Bilder, Video, Audio und PDFs in einen einheitlichen Vektorraum abbildet. Es basiert auf der Gemini-Architektur und erzeugt standardmäßig 3.072-dimensionale Float-Vektoren mit Matryoshka Representation Learning (MRL) für flexible Ausgabedimensionen. Das Modell unterstützt über 100 Sprachen und ist als Cloud-API über die Gemini API und Vertex AI verfügbar. Es wurde am 10. März 2026 als Public Preview und am 22. April 2026 als General Availability (GA) veröffentlicht.
Momentum-Verlauf
04.04.03.07.
Features
| Deployment (Self-host/Cloud) | Ausschließlich Cloud-API (kein Self-Hosting / On-Premises). Verfügbar über Gemini API und Vertex AI. |
| Durchsatz/Latenz | Keine offiziell publizierten Latenz-/Durchsatzwerte. Laut Nutzerbericht: bis zu 70 % Latenzreduktion gegenüber Multi-Modell-Pipelines (Kundenzitat, kein offizieller Benchmark). |
| Lizenz | Proprietär – Gemini API Additional Terms of Service (Google). Free Tier: Daten werden zur Produktverbesserung genutzt; Paid Tier: keine Nutzung für Training. |
| Plattform | Gemini API (ai.google.dev) & Vertex AI / Gemini Enterprise Agent Platform (Google Cloud). Ökosystem-Integrationen: LangChain, LlamaIndex, Haystack, Weaviate, Qdrant, ChromaDB, Vector Search. |
| Preis | Text: $0,20/1M Tokens; Bild: $0,45/1M Tokens; Audio: $6,50/1M Tokens; Video: $12,00/1M Tokens. Free Tier verfügbar (Rate-limitiert). Batch-API: 50 % Rabatt. |
| Protokoll-Kompatibilität | REST API (Gemini API Embedding-Endpunkt). OpenAI-Kompatibilitätsbibliothek unterstützt (Batch-API). SDKs: Google Gen AI SDK (Python, Node.js, Java u. a.). |
| Release-Datum | Public Preview: 10. März 2026 | GA: 22. April 2026 |
| Unterstützte Modelle/Provider | Modell-ID: gemini-embedding-2 (GA) / gemini-embedding-2-preview. Input: Text (bis 8.192 Tokens), bis zu 6 Bilder (PNG/JPEG), Video bis 120 s (MP4/MOV), Audio bis 180 s (nativ), PDFs bis 6 Seiten. Output: 3.072-dim Vektoren (MRL: skalierbar auf 1.536, 768, 128). |