← Zurück zu Einblicke

Anthropics Code with Claude 2026: Compute-Durchbruch, Agenten-Revolution und die neue Ära für Entwickler

Nils Liu
GenAI Nachrichten Anthropic Claude Developer AI Agents
Anthropics Code with Claude 2026: Compute-Durchbruch, Agenten-Revolution und die neue Ära für Entwickler

Am 6. Mai 2026 eröffnete Anthropic Code with Claude 2026 in San Francisco, gefolgt von London (19. Mai) und Tokio (10. Juni). Kein neues Modell angekündigt. Das war auch nicht das Ziel.

Die Konferenz drehte sich um ein einziges Problem: Claude ist auf dem Papier leistungsfähig, aber zuverlässig in der Produktion zu betreiben ist immer noch schwierig. Alles Angekündigte — Compute, Agenten, Tooling, Kosten — zielt auf genau diese Lücke.


1. Der SpaceX-Deal

Anthropic hatte lange mit Compute-Engpässen zu kämpfen. Das ändert sich jetzt. Das Unternehmen gab langfristigen Exklusivzugang zu Colossus 1 bekannt, SpaceXs KI-Rechenzentrum in Memphis — über 220.000 NVIDIA-GPUs (H100, H200 und GB200) an einem Standort.

Die Hintergründe sind dünn an öffentlichen Details. Es gab Gespräche auf hoher Ebene, Anthropics Safety-first-Kultur hinterließ einen Eindruck, und ein Deal wurde abgeschlossen.

Was Entwickler direkt merken:

  • Claude Codes Fünf-Stunden-Rate-Limit verdoppelt für Pro, Max und Enterprise
  • Peak-Hour-Drosselung für Pro- und Max-Konten entfernt
  • Opus-API-Limits deutlich erhöht

2. Opus 4.7 und Task Time Horizon

Kein neues Modell, aber eine neue Art zu messen, was bestehende Modelle tatsächlich können.

Produktionszahlen

Coding-Agenten auf Opus 4.7 Smart Mode lösen dreimal so viele Produktions-Engineering-Aufgaben wie die Vorgeneration. Das API-Volumen auf der Claude-Plattform ist um fast 70x im Jahresvergleich gestiegen. Der durchschnittliche Claude Code-Entwickler verbringt jetzt 20 Stunden pro Woche mit dem Tool — das ist keine Experimentierphase mehr, das ist eine Workflow-Abhängigkeit.

Task Time Horizon

Anthropic führte diese Metrik ein, um zu beschreiben, wie lange eine KI autonom laufen kann, ohne an einen Menschen übergeben zu müssen. Claude ist von der Bearbeitung von Aufgaben, die wenige Minuten dauern, zu zuverlässigen mehrstündigen autonomen Läufen übergegangen. Das ändert, wie man Workflows entwirft — man hört auf, in Prompts zu denken und fängt an, in Jobs zu denken.


3. Managed Agents: Drei Updates

Die Agenten-Plattform bekam die bedeutsamsten Updates der Konferenz. Jedes adressiert einen spezifischen Grund, warum KI-Agenten in der Produktion scheitern.

Multi-Agent-Orchestrierung (Public Beta)

Ein Lead-Agent teilt eine Aufgabe in Stücke auf und delegiert jedes an einen Spezialisten-Sub-Agenten mit eigenem Modell, eigenem Prompt und eigenen Tools — und eigenem isolierten Kontext. Netflix verarbeitet damit gerade Logs von Hunderten gleichzeitiger Builds parallel. Diese Architektur funktioniert für jeden Bereich, der koordinierte mehrstufige Ausführung braucht: Logistik, Fertigung, Finanzen.

Outcomes (Public Beta)

Zu definieren, wie „Erfolg” aussieht, war immer der schwierige Teil beim Einsatz von KI auf echten Aufgaben. Mit Outcomes schreibt man eine Markdown-Rubrik. Das System erstellt einen unabhängigen Bewertungsagenten zur Ergebniskontrolle. Wenn das Ziel nicht erreicht wird, versucht der Agent es bis zu einem konfigurierten Maximum erneut — kein Mensch muss eingreifen.

Wisedocs, ein Unternehmen für medizinische Dokumentenprüfung, hat die Prüfzeit nach dem Einsatz von Outcomes um 50% reduziert.

Dreaming (Research Preview)

Nach Ende einer Sitzung überprüft der Agent seine eigene Ausführungsgeschichte — extrahiert Muster, Lektionen und Fehlermuster — und schreibt sie in einen persistenten Speicher für zukünftige Läufe.

Harvey, ein Legal-AI-Unternehmen, verzeichnete nach der Implementierung von Dreaming einen Anstieg der Aufgabenabschlussrate um ca. 6x. In einer Live-Demo wechselte ein Agent von 4/6 auf 6/6 beim zweiten Durchlauf derselben Aufgabe ohne weitere Änderungen.


4. Claude Code-Updates

Jedes Update zielt auf dasselbe: die Anzahl der Momente reduzieren, in denen ein Mensch eingreifen muss.

Routines

Einmal konfigurieren, per CRON, GitHub Webhook oder API auslösen. Claude überwacht Issues über Nacht, behebt Bugs, öffnet PRs — vollständig unbeaufsichtigt.

Automode

Ein dualer Sicherheitsklassifizierer bewertet jede Aktion vor der Ausführung. Nicht-destruktive Aktionen ohne Prompt-Injection-Risiko werden automatisch durchgeführt. Das entfernt die Genehmigungsaufforderungen, die den Flow bei komplexen autonomen Abläufen unterbrechen.

Worktrees

Git-Worktree-Einrichtung ist jetzt schnell und einfach. Isolierte Umgebungen entstehen für parallele Feature-Arbeit und bereinigen sich automatisch, wenn sie fertig sind.

Auto-memory

Claude schreibt Projektkontext, Build-Befehle und Team-Präferenzen sitzungsübergreifend in memory.md. Man hört auf, seinen Codebase zu Beginn jedes Gesprächs neu zu erklären.

Claude Review

Mehrere Spezialisten-Agenten bewerten unabhängig Sicherheit, Lesbarkeit und Performance. Ein Validierungsagent fasst die Ergebnisse zusammen. Mercado Libres 23.000 Ingenieure nutzen das — die Plattform hat über 500.000 Pull Requests überprüft und strebt 90% autonomes Coding bis Q3 2026 an.


5. GitHub-Partnerschaft und Kosten

Der GitHub Copilot-Produktverantwortliche teilte, wie hochvolumige API-Nutzung auf Engineering-Ebene tatsächlich aussieht.

Prompt-Caching: System-Prompts und Tool-Präfixe müssen vollständig statisch bleiben, um 94–96% Cache-Hit-Raten zu erreichen. In diesem Maßstab ist das keine Performance-Optimierung — so verhindert man, dass Inferenzkosten außer Kontrolle geraten.

Advisor-Pattern: Routineaufgaben über günstige Modelle wie Haiku leiten. Automatisch auf Opus eskalieren, wenn die Aufgabe das kleinere Modell überfordert. Das senkt die Inferenzkosten um 5x, ohne die Ausgabequalität bei wichtigen Entscheidungen zu beeinträchtigen.


6. Darios und Danielas Roundtable

Die Gründer schlossen die Konferenz. Einige Punkte, die es wert sind, festgehalten zu werden.

80-faches annualisiertes Wachstum in Q1 2026. Das ist der Grund für den SpaceX-Deal — die bestehende Infrastruktur konnte mit der Nachfrage nicht mithalten.

Amdahls Gesetz trifft das Code-Review. Darios Einschätzung: Wenn das Coding mit KI schneller wird, verlagert sich der Flaschenhals zu Review und Änderungsverifizierung. Die nächste Automatisierungswelle schreibt keinen Code — sie prüft ihn.

MESOS existiert und wird nicht veröffentlicht. Anthropic hat ein internes Modell, das deutlich leistungsfähiger ist als alles Öffentliche. Es wird erst veröffentlicht, wenn die Sicherheitsevaluierung abgeschlossen ist. Das ist die Richtlinie, und sie halten daran fest.

Das Solo-Einhorn. Dario glaubt, dass ein Ein-Personen-Unternehmen mit einem Wert von 1 Milliarde Dollar vor Ende 2026 existieren wird — Registrierung, Design, Entwicklung, Wartung und Kundenservice komplett durch KI abgewickelt.


Kurz gesagt

Claude ist gut genug. Das Problem ist, es zuverlässig im Produktionsmaßstab zu betreiben — zu akzeptablen Kosten, ohne ständige menschliche Aufsicht. Das war es, was Code with Claude 2026 adressiert hat. Nicht mit einem neuen Modell, sondern mit Infrastruktur, Tooling und Agenten-Architektur, die Deployment handhabbar macht.

Weiterführende Artikel:

Abonnieren Sie die neuesten Erkenntnisse

Abonnieren Sie den Newsletter, um meine neuesten Artikel über AI Agents in Finanzinstituten, GenAI und Architektur zu erhalten.

Kein Spam. Jederzeit kündbar.