

Talkie
#10independent-researchers · seit April 2026 · 14× · zuletzt 30. Juni 2026
Talkie (offiziell: talkie-1930) ist ein 13-Milliarden-Parameter Open-Weight-Sprachmodell, das ausschließlich auf englischsprachigen Texten aus der Zeit vor 1931 trainiert wurde – Bücher, Zeitungen, Zeitschriften, Patente und Gerichtsakten. Entwickelt von Nick Levine, David Duvenaud und Alec Radford, dient es primär als kontaminationsfreies Forschungswerkzeug zur Untersuchung von LLM-Generalisierung und temporaler Wissensbegrenzung. Das Trainings-Cutoff-Datum ist der 31. Dezember 1930, gewählt weil Werke aus dieser Zeit in den USA gemeinfrei sind. Neben dem Basismodell (talkie-1930-13b-base, 260 Mrd. Tokens) existiert eine instruction-tuned Variante (talkie-1930-13b-it), die mittels historischer Referenzwerke und Online-DPO feinjustiert wurde.
Features
| Kanäle | 1) HuggingFace (Modell-Download); 2) GitHub (Inference-Bibliothek / CLI / Python-API); 3) Web-Demo talkie-lm.com/chat (öffentlich, mit Qwen3Guard-Gen-4B-Moderation) |
| Lizenz | Apache 2.0 (beide Varianten: talkie-1930-13b-base und talkie-1930-13b-it) |
| Modalitäten | Ausschließlich Text (Text-in → Text-out); kein Bild-, Audio- oder Multimodal-Support laut offizieller Dokumentation |
| Preis | Kostenlos (Open-Weight, Download über HuggingFace; öffentliche Web-Demo unter talkie-lm.com/chat ebenfalls kostenlos zugänglich) |
| Release-Datum | April 2026 |
| Tool-/MCP-Integrationen | Keine dokumentierten Tool-/MCP-Integrationen; das GitHub-Paket bietet lediglich eine einfache Python-API und CLI für lokale Inferenz und HuggingFace-Download |