Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium
synthszr charts
google-deepmind

AlphaProof Nexus

#7

google-deepmind · seit 21. Mai 2026 (arXiv-Preprint 2605.22763v1) · 17× · zuletzt 30. Juni 2026

55
Momentum

AlphaProof Nexus ist ein von Google DeepMind veröffentlichtes Forschungs-Framework (kein kommerzielles Produkt), das Gemini 3.1 Pro als LLM mit dem Lean-Beweisassistenten kombiniert, um mathematische Beweise automatisch zu generieren und maschinell zu verifizieren. Das System nutzt einen mehrstufigen Agenten-Aufbau (vier Varianten von einfachem LLM-Compiler-Loop bis zu evolutionärer Suche mit Elo-Bewertung) und griff dabei optional auf das ältere RL-basierte AlphaProof als Subagenten zurück. Laut dem zugehörigen arXiv-Preprint (21. Mai 2026) löste das System autonom 9 von 353 offenen Erdős-Problemen sowie 44 von 492 offenen OEIS-Vermutungen, bei Inferenzkosten von wenigen hundert Dollar pro Problem. Alle generierten Lean-Beweise sind unter Apache-2.0-Lizenz auf GitHub öffentlich einsehbar.

Momentum-Verlauf
04.04.03.07.

Features

Key-Benchmark (%)9/353 offene Erdős-Probleme gelöst (~2,5%); 44/492 OEIS-Vermutungen bewiesen (~9%)
LizenzApache License 2.0 (Ergebnis-Repository auf GitHub)
MultimodalitätNicht multimodal – textbasierte Lean-Beweisgenerierung und -Verifikation
PlattformForschungs-Framework: Gemini 3.1 Pro + Lean-Compiler (sandboxed), optional AlphaProof-Subagent; Code/Proofs auf GitHub
Preis pro 1M TokenNicht angegeben; nur Gesamt-Inferenzkosten von 'a few hundred dollars per problem' dokumentiert
Release-Datum21. Mai 2026 (arXiv-Preprint 2605.22763v1 veröffentlicht)

Belege (17)

Subscribe free. Unsubscribe the second it sucks.

High-signal news across AI, business, UX, and tech. Every morning.