

Pplx Embed
#8perplexity · seit 2026-02-26 · 2× · zuletzt 30. Juni 2026
pplx-embed ist eine am 26. Februar 2026 von Perplexity AI veröffentlichte Familie multilingualer Text-Embedding-Modelle, bestehend aus vier Varianten: pplx-embed-v1 (Standard-Dense-Retrieval) und pplx-embed-context-v1 (kontextuelles Chunking für RAG), jeweils in 0,6B- und 4B-Parametergröße. Die Modelle basieren auf Qwen3-Basismodellen, die per Diffusions-Pretraining in bidirektionale Encoder umgewandelt wurden, und erzeugen nativ INT8- bzw. binärquantisierte Embeddings ohne Instruktions-Präfixe. Alle Gewichte sind unter MIT-Lizenz auf Hugging Face verfügbar und die Modelle sind zusätzlich über die Perplexity API abrufbar. Auf dem MTEB Multilingual v2 Retrieval-Benchmark erreicht pplx-embed-v1-4B (INT8) 69,66 % nDCG@10 und übertrifft damit Google Gemini-embedding-001 (67,71 %).
Features
| Multimodale Fähigkeiten | Keine multimodalen Fähigkeiten – ausschließlich Text-Embeddings (kein Bild-, Audio- oder Video-Input dokumentiert) |
| Preis pro 1M Tokens | pplx-embed-v1-0.6b: $0,004 / 1M Tokens; pplx-embed-v1-4b: $0,030 / 1M Tokens; pplx-embed-context-v1-0.6b: $0,008 / 1M Tokens; pplx-embed-context-v1-4b: $0,050 / 1M Tokens |