Claude Opus 4.8: 41-Tage-Zyklus und dynamische Workflows für hunderte parallele Agenten
Kurzfassung
Anthropic veröffentlicht Claude Opus 4.8 nur 41 Tage nach Opus 4.7: Agentic-Coding-Score steigt auf 69,2%, Fast-Mode-Preis sinkt um zwei Drittel, neue dynamische Workflows steuern hunderte parallele Subagenten. Mythos-Klasse-Modelle folgen in Wochen.
Anthropic hat Claude Opus 4.8 am 28. Mai 2026 veröffentlicht, nur 41 Tage nach Opus 4.7. Das beschleunigte Tempo spiegelt den Wettbewerbsdruck wider: OpenAI Codex holt bei Agentic-Coding-Benchmarks auf, Google Gemini Flash setzt bei den Kosten unter Druck.
Dynamische Workflows: Hunderte parallele Agenten für eine Aufgabe
Das wichtigste neue Feature sind dynamische Workflows, derzeit als Research Preview in Claude Code verfügbar. Claude zerlegt eine große Aufgabe automatisch in hunderte parallele Sub-Agenten, die gleichzeitig arbeiten, und führt deren Ergebnisse zusammen.
Anthropic beschreibt den Umfang direkt: Das System “kann jetzt Codebasis-weite Migrationen über hunderttausende Zeilen Code von Kickoff bis Merge durchführen, mit der bestehenden Testsuite als Abnahmekriterium.” Die Sprache ist auf Produktionseinsatz ausgerichtet und zeigt auf konkrete Enterprise-Migrations-Szenarien.
Benchmarks und Preisgestaltung
Die Zahlen: Agentic Coding Score steigt von 64,3% auf 69,2%, multidisziplinäres Reasoning von 54,7% auf 57,9%, Online-Mind2Web-Browser-Agent-Tasks bei 84%, höchster Score im Legal Agent Benchmark. Anthropic schätzt, dass Opus 4.8 viermal seltener Code-Fehler übersieht als sein Vorgänger.
Bridgewater Associates bestätigte dies in Tests: Das Unternehmen stellte fest, dass Opus 4.8 proaktiv Bedenken zu Eingaben und Ausgaben einer Analyse kennzeichnet, was frühere Modelle “routinemäßig übersehn” hätten.
Standardpreise bleiben unverändert bei 5 Dollar pro Million Input-Tokens und 25 Dollar pro Million Output-Tokens. Der Fast-Mode-Preis sinkt deutlich: von 30/150 Dollar auf 10/50 Dollar pro Million Tokens, also um zwei Drittel. Für Teams mit häufigen Agenten-Schleifen ändert sich die Kostenrechnung spürbar.
Verbesserungen bei Ehrlichkeit
Anthropic sagt, Opus 4.8 gibt Unsicherheiten direkter zu. Das Muster, bei dem Modelle unsichere Ergebnisse selbstsicher präsentieren, ist einer der häufigsten und kostspieligsten Fehlertypen in langen Agenten-Pipelines. Diese Verbesserung wirkt sich direkt auf die Produktionszuverlässigkeit aus, auf eine Weise, die aggregierte Benchmark-Scores nicht abbilden.
Das Iterationstempo
Der Launch von Opus 4.7 fand mäßige Aufnahme; ein 41-Tage-Nachfolger zeigt, wie Anthropic dieses Signal gelesen hat. Das Unternehmen teilte außerdem mit, dass Mythos-Klasse-Modelle “in den kommenden Wochen” allgemein verfügbar werden sollen, sobald die Sicherheitsmechanismen finalisiert sind.
Der Mythos-Zugang bleibt über Project Glasswing beschränkt, während die Sicherheitstests laufen. Anthropic schloss letzte Woche eine Series-H-Finanzierung über 65 Milliarden Dollar bei einer Bewertung von 965 Milliarden Dollar ab, die dieses aggressive Release-Tempo finanziert.
Weiterführende Artikel:
- Anthropics Project Glasswing: Claude Mythos für ausgewählte Unternehmenspartner
- Anthropic Series H: 65 Mrd. Dollar, 965-Mrd.-Bewertung übertrifft OpenAI
Quellen:
- Introducing Claude Opus 4.8 (Anthropic, 2026-05-28)
- Anthropic releases Opus 4.8 with new ‘dynamic workflow’ tool (TechCrunch, 2026-05-28)
Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.
Verwandte Artikel
Claude Fable 5 veröffentlicht: Anthropics erstes öffentliches Mythos-Klasse-Modell
Anthropic veröffentlichte am 9. Juni 2026 Claude Fable 5 — das erste öffentlich verfügbare Modell der Mythos-Klasse. Analytics-Benchmarks überschreiten 90% (+10 Punkte gegenüber Opus 4.8), SWE-Bench erreicht 80,3%, Preis liegt bei $10/$50 pro MTok, und ein Sicherheitsklassifikator leitet Hochrisikoanfragen an Opus 4.8 weiter.
Project Fetch Phase 2: Claude Opus 4.7 programmiert Roboterhund 37-mal schneller, der Ball bleibt liegen
Anthropic Project Fetch Phase 2: Claude Opus 4.7 schrieb autonom Steuercode für einen Roboterhund 37-mal schneller als das beste menschliche Team ohne KI-Unterstützung, mit einem Zehntel der Codezeilen. Der Roboterhund holte den Ball trotzdem nicht. Das Ergebnis ist Meilenstein und ehrliche Grenzmarkierung zugleich.