Language

Synthszr Charts — die großen AI-Marken im Wettkampf ums Podium

AlphaProof Nexus

google-deepmind · seit 21. Mai 2026 (arXiv-Preprint 2605.22763v1) · 17× · zuletzt 30. Juni 2026

Momentum

AlphaProof Nexus ist ein von Google DeepMind veröffentlichtes Forschungs-Framework (kein kommerzielles Produkt), das Gemini 3.1 Pro als LLM mit dem Lean-Beweisassistenten kombiniert, um mathematische Beweise automatisch zu generieren und maschinell zu verifizieren. Das System nutzt einen mehrstufigen Agenten-Aufbau (vier Varianten von einfachem LLM-Compiler-Loop bis zu evolutionärer Suche mit Elo-Bewertung) und griff dabei optional auf das ältere RL-basierte AlphaProof als Subagenten zurück. Laut dem zugehörigen arXiv-Preprint (21. Mai 2026) löste das System autonom 9 von 353 offenen Erdős-Problemen sowie 44 von 492 offenen OEIS-Vermutungen, bei Inferenzkosten von wenigen hundert Dollar pro Problem. Alle generierten Lean-Beweise sind unter Apache-2.0-Lizenz auf GitHub öffentlich einsehbar.

Momentum-Verlauf

04.04.03.07.

Features

Key-Benchmark (%)	9/353 offene Erdős-Probleme gelöst (~2,5%); 44/492 OEIS-Vermutungen bewiesen (~9%)
Lizenz	Apache License 2.0 (Ergebnis-Repository auf GitHub)
Multimodalität	Nicht multimodal – textbasierte Lean-Beweisgenerierung und -Verifikation
Plattform	Forschungs-Framework: Gemini 3.1 Pro + Lean-Compiler (sandboxed), optional AlphaProof-Subagent; Code/Proofs auf GitHub
Preis pro 1M Token	Nicht angegeben; nur Gesamt-Inferenzkosten von 'a few hundred dollars per problem' dokumentiert
Release-Datum	21. Mai 2026 (arXiv-Preprint 2605.22763v1 veröffentlicht)

AlphaProof Nexus

Features

Belege (17)

Subscribe free. Unsubscribe the second it sucks.