← Zurück zu Einblicke

US-Regierung zwingt Anthropic zur Abschaltung von Fable 5 und Mythos 5: Ein „schmaler Jailbreak” legt die stärksten Modelle lahm

Nils Liu
GenAI Nachrichten AI Policy Anthropic LLM

Kurzfassung

Das US-Handelsministerium ordnete die Sperrung von Anthropics leistungsstärksten Modellen Fable 5 und Mythos 5 an – ausgelöst durch einen engen Jailbreak mit Cybersicherheitsbezug. Anthropic folgte der Anweisung und widersprach ihr gleichzeitig.

US-Regierung zwingt Anthropic zur Abschaltung von Fable 5 und Mythos 5: Ein „schmaler Jailbreak” legt die stärksten Modelle lahm

Am 12. Juni 2026 um 17:21 Uhr ET erhielt Anthropic eine Anweisung des US-Handelsministeriums: Die Modelle Fable 5 und Mythos 5 sind sofort zu sperren. Die Anordnung galt für alle „ausländischen Staatsangehörigen” — ob im Ausland oder innerhalb der USA, einschließlich Anthropic-Mitarbeiter ohne US-Staatsbürgerschaft.

Anthropic stand vor einer unmöglichen Wahl. Ausländische Nutzer in Echtzeit identifizieren und selektiv sperren — technisch kaum umsetzbar — oder beide Modelle für alle Nutzer weltweit abschalten. Innerhalb weniger Stunden verloren Millionen von Nutzern ohne Vorwarnung den Zugang zu den leistungsstärksten KI-Modellen des Unternehmens.

Der Jailbreak hinter der Anordnung

Laut Anthropics offizieller Stellungnahme erhielt das Handelsministerium einen Bericht, dem zufolge jemand eine Methode gefunden hatte, die Sicherheitsfilter von Fable 5 zu umgehen und dadurch Zugang zu den Cybersicherheitsfähigkeiten von Mythos zu erlangen. Die Technik war simpel: Das Modell auffordern, „eine bestimmte Codebasis zu lesen und vorhandene Softwarefehler zu beheben.”

Das klingt nach alltäglicher Entwicklungsarbeit — und ist es auch. Mythos wurde jedoch genau für diese Art intensiver Schwachstellenforschung entwickelt. Es ist der Kern von Project Glasswing, Anthropics Initiative zur proaktiven Identifizierung von Zero-Day-Schwachstellen in kritischer Software. Als diese Fähigkeiten durch einen engen Jailbreak zugänglich wurden, stufte die Regierung dies als Exportkontrollrisiko ein.

Anthropic wies darauf hin, dass OpenAI’s GPT-5.5 über vergleichbare Fähigkeiten verfügt und die Sperrung eines einzigen Modells alle anderen Zugangswege offen lässt.

Anthropics Reaktion: Befolgen und Widersprechen

Anthropics Stellungnahme war ungewöhnlich direkt: „Wir sind nicht der Meinung, dass ein enger potenzieller Jailbreak Anlass sein sollte, ein kommerzielles Modell zurückzuziehen, das für Hunderte von Millionen Menschen eingesetzt wird.”

Das Unternehmen argumentierte weiter, dass die Anwendung dieses Maßstabs auf die gesamte Branche „im Wesentlichen alle neuen Modelleinführungen stoppen würde.” Das ist eine Herausforderung an die Regulierungslogik selbst: Rechtfertigt eine enge Schwachstelle in einem spezifischen Anwendungsfall eine globale Sperrung?

Ein konkretes Datum für die Wiederherstellung des Zugangs wurde nicht genannt. Anthropic erklärte, man arbeite daran, „den Zugang so schnell wie möglich wiederherzustellen.”

Geteilte Reaktionen aus der Branche

KI-Politikforscher Dean Ball bezeichnete die Entscheidung als „schlichtweg absurd” und verwies auf einen Widerspruch in der Position der Trump-Administration: einerseits für breite KI-Exporte in die Welt werben, andererseits verbündeten Nationen wegen eines engen Jailbreaks den Zugang verweigern.

Der Cybersicherheitsforscher Peter Girnus richtete seine Kritik direkt an Anthropic: „Wenn man sein Produkt in jeder Pressemitteilung als Waffe beschreibt, nimmt die Regierung einen irgendwann beim Wort.” Anthropics Positionierung als das sicherste Frontier-KI-Labor — inklusive aktiver Zusammenarbeit mit Regierungsbehörden bei der Schwachstellensuche — hat sich nun gegen das Unternehmen gewendet.

Gary Marcus unterstützte die Entscheidung hingegen und sah sie als konsistent mit dem Schutz der US-amerikanischen KI-Führungsposition an.

Ein Muster, keine Ausnahme

Diese Direktive fügt sich in ein bekanntes Muster ein. Die Trump-Administration hatte im Februar 2026 die Bundesnutzung von Anthropic-KI ausgesetzt und das Unternehmen im März als „Lieferkettenrisiko” eingestuft. Die Exportkontrollanordnung vom Juni folgt derselben Linie.

Project Glasswings öffentliches Profil liefert wichtigen Kontext. Seit April 2026 haben Anthropic und rund 50 Partnerorganisationen, darunter AWS, Apple, Cisco, Google, JPMorgan Chase und Microsoft, Mythos eingesetzt, um mehr als 10.000 schwerwiegende oder kritische Schwachstellen in weit verbreiteter Software zu identifizieren. Zu den Funden zählen eine 16 Jahre alte FFmpeg-Schwachstelle und eine FreeBSD-NFS-Remote-Code-Execution-Lücke, die als CVE-2026-4747 registriert wurde. Wenn die offensiven Fähigkeiten eines Modells so gut dokumentiert sind, schalten Regulierungsbehörden auf Aufmerksamkeit.

Was das bedeutet

Fable 5 und Mythos 5 sind Anthropics leistungsstärkste Modelle. Die gleichzeitige Abschaltung beider trifft Unternehmenskunden und Entwickler, die auf Frontier-Leistung angewiesen sind. Anthropic bestätigte, dass alle anderen Modelle weiterhin zugänglich sind — für Teams, die spezifisch Top-Level-Fähigkeiten benötigen, gibt es jedoch keinen direkten Ersatz.

Die wichtigere Frage ist, ob dies zum Präzedenzfall wird. Exportkontrollen haben historisch auf Hardware gezielt, vor allem auf Halbleiter. Die Anwendung auf cloudbasierte Softwaremodelle wirft technische und rechtliche Fragen auf, die noch nicht gelöst sind. Wenn ein „enger Jailbreak” eine vollständige Sperrung auslösen kann, ist jedes Frontier-Modell demselben Risiko ausgesetzt.

Dies könnte der erste sichtbare Reibungspunkt sein.

Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.


Weiterführende Links:

Abonnieren Sie die neuesten Erkenntnisse

Abonnieren Sie den Newsletter, um meine neuesten Artikel über AI Agents in Finanzinstituten, GenAI und Architektur zu erhalten.

Kein Spam. Jederzeit kündbar.