GPT-5.5-Cyber geht live: OpenAI fand mit KI 24 Linux-Kernel-Exploits und startet Patch-the-Planet-Initiative
Kurzfassung
OpenAI veröffentlichte am 22. Juni GPT-5.5-Cyber. Das Daybreak-Team fand bereits 24 Linux-Kernel-Exploits, 5 Chrome-V8-Schwachstellen und 10 Safari-Lücken. Die CyberGym-Wertung von 85,6 Prozent ist die Schlagzeile. Die ExploitGym-Wertung von 39,5 Prozent erklärt, warum der Zugang auf geprüfte Verteidiger beschränkt bleibt.
Dieser Artikel stellt fast ausschliesslich die Verteidigungsperspektive dar, weil das die Seite ist, die OpenAI veröffentlicht hat. Die Frage, die darunter liegt: Welche Konsequenzen hat ein ExploitGym-Wert von 39,5 Prozent, wenn dieselbe Modellklasse nicht nur bei geprüften Verteidigern landet? Wer in der Bedrohungsanalyse arbeitet und in den letzten Monaten Signale einer KI-gestützten Exploit-Entwicklung durch staatliche Akteure beobachtet hat, kann hier etwas beitragen, was in keiner offiziellen Stellungnahme steht.
Am 22. Juni brachte OpenAI GPT-5.5-Cyber in den Vollbetrieb und veröffentlichte gleichzeitig die Ergebnisse des Daybreak-Forschungsprogramms der vergangenen sechs Monate.
Die Befundliste ist konkret: 24 lokale Privilegienerweiterungsexploits im Linux-Kernel, 8 Proof-of-Concepts zu Kernel-Pointer-Informationsleaks, 34 FreeBSD-Schwachstellen, 6 dnsmasq-Fehler, 5 ausnutzbare Chrome-V8-Schwachstellen und 10 ausnutzbare Apple-Safari-Schwachstellen. Alle Funde wurden vor der Ankündigung im Rahmen eines koordinierten Responsible-Disclosure-Verfahrens an die jeweiligen Maintainer gemeldet.
Parallel zum Modell lancierte OpenAI die Initiative Patch the Planet, eine Kooperation mit Trail of Bits und HackerOne. Das Ziel: KI-gestützte Schwachstellenanalyse und Patch-Generierung für weit verbreitete Open-Source-Projekte wie cURL, Go, Python, Sigstore und aiohttp.
Was Daybreak konkret macht
GPT-5.5-Cyber ist darauf ausgelegt, Schwachstellenerkennung, Angriffspfadverfolgung und Patch-Generierung zu automatisieren. Das aktualisierte Codex-Security-Plugin unterstützt einen durchgängigen Workflow von SARIF-Exporten bis zur CodeQL-Integration, mit codebasis-spezifischer Patch-Generierung und Schweregrad-Bewertung.
Der Zugang ist strikt eingeschränkt. GPT-5.5-Cyber steht nur Organisationen offen, die das Daybreak-Prüfverfahren von OpenAI durchlaufen haben. Bestätigte Regierungspartner sind Australien, Kanada, Frankreich, Deutschland, Japan, Südkorea sowie die EU-Agentur ENISA. Der kommerzielle Zugang läuft über mehr als 25 zertifizierte Daybreak-Partner.
Seit dem Vorschau-Start im März hat Codex Security über 30 Millionen Commits aus mehr als 30.000 Codebasen gescannt. Die offizielle Patch-the-Planet-Seite nennt zwei Kennzahlen: 500.000 automatisch bearbeitete Sicherheitsbefunde und 70.000 manuell geprüfte Patches.
Was die Zahlen wirklich sagen
CyberGym ist ein von OpenAI selbst entwickelter Benchmark ohne unabhängige Drittvalidierung. Diese Einschränkung gilt bei der Lektüre der Hauptzahl. GPT-5.5-Cyber mit 85,6 Prozent gegenüber Anthropics Mythos 5 mit 83,8 Prozent ergibt einen Abstand von 1,8 Prozentpunkten. Ohne unabhängige Replikation lautet die sachliche Einordnung: zwei Modelle auf vergleichbarem Niveau, kein eindeutiger Vorsprung.
Die ExploitGym-Zahl verdient mehr Aufmerksamkeit als die CyberGym-Zahl. ExploitGym misst, wie oft das Modell bei einem bekannt verwundbaren Ziel funktionierende Exploit-Code erzeugt. Der Sprung von 25,95 Prozent bei GPT-5.5 auf 39,5 Prozent bei GPT-5.5-Cyber bedeutet: Fast vier von zehn Versuchen gegen ein verifiziert verwundbares Ziel produzieren ausführbaren Angriffscode. Genau das veranlasste fünf Nachrichtendienste zu der gemeinsamen Warnung, KI-Modelle der Spitzenklasse verkürzten das Zeitfenster zwischen Schwachstellen-Offenlegung und Ausnutzung erheblich. Die Zugangsbeschränkung ist eine direkte Konsequenz dieser Zahl.
Das Verhältnis von 500.000 automatisch bearbeiteten Befunden zu 70.000 manuell verifizierten Patches entspricht einer Akzeptanzrate von rund 14 Prozent. Bedeutung: KI beschleunigt die Entdeckung und Erstklassifizierung erheblich, aber rund 86 Prozent der automatisch generierten Patch-Vorschläge bestehen die menschliche Qualitätsprüfung nicht. Die letzte Meile des Patchens bleibt menschliche Entscheidung.
Eine Kostenschätzung für das Scanning: 30 Millionen Commits, durchschnittlich 1.000 Token pro Diff, ergeben 30 Milliarden Input-Token. Zu GPT-5.5-Inferenzpreisen entspricht das reinen Scan-Kosten von 100.000 bis 200.000 Dollar. Das erklärt, warum Patch the Planet als zentrales OpenAI-Programm konzipiert ist und nicht als Toolkit für einzelne Entwicklungsteams.
Traditionelle Bug-Bounty-Programme zahlen für einzelne kritische Schwachstellen zwischen 30.000 und 150.000 Dollar. Fünf ausnutzbare Chrome-V8-Lücken und zehn Safari-Schwachstellen ergeben konservativ gerechnet einen Gegenwert von über 500.000 Dollar. Diese Funde entstanden durch einen systematischen KI-Scan. Welche Auswirkungen das auf die Preisgestaltung von Googles und Apples Vulnerability-Reward-Programmen hat, bleibt eine offene Frage für das zweite Halbjahr 2026.
Drei Indikatoren, die in den nächsten Monaten zählen
Patch the Planet umfasst cURL, Go und Python. Die drei Projekte kommen zusammen auf mehr als eine Milliarde täglicher Downloads. Wenn bis Ende Q3 2026 keines dieser Projekte in einer CVE-Meldung explizit auf GPT-5.5-Cyber oder Daybreak als Entdeckungsmechanismus hinweist, ist die Initiative entweder langsamer als die Ankündigung nahelegte, oder die Zuschreibungssprache befindet sich noch in juristischer Klärung.
Die aktuelle Daybreak-Partnerliste enthält keine Nicht-G7-Nation aus dem Pazifikraum und keine Sicherheitsbehörde aus dem Nahen Osten. Der erste Beitritt eines Landes ausserhalb dieser Gruppe, und wie schnell die Liste bis Ende 2026 wächst, ist ein konkreter Indikator für OpenAIs Positionierung in der geopolitischen Sicherheitslandschaft.
Die Patch-Reaktionszeiten von Google und Apple auf die Daybreak-Schwachstellen sind der dritte messbare Datenpunkt. Beide Unternehmen veröffentlichen CVE-Meldungen mit Danksagungstext. Wenn ihre Reaktionszeiten länger sind als ihre historischen Durchschnittswerte für ähnliche Schweregrade, deutet das darauf hin, dass KI-gestützte Entdeckungsgeschwindigkeiten die Aufnahmekapazität traditioneller Patch-Prozesse bereits übersteigen.
Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.
Weiterführende Artikel
Verwandte Artikel
GPT-5.6 vor dem Start blockiert: Weißes Haus erlässt erste US-KI-Regulierung vor Markteinführung
Das Weiße Haus forderte OpenAI auf, GPT-5.6 auf rund 20 staatlich genehmigte Unternehmen zu beschränken. Ein historischer Präzedenzfall: Erstmals schränkt die US-Regierung ein inländisches KI-Modell noch vor dem Launch ein.
GPT-5.6 Sol gestartet, aber gesperrt: Wie Washington den Zugang zu KI-Spitzenmodellen kontrolliert
GPT-5.6 Sol wurde am 26. Juni veröffentlicht, ist aber nur für 20 von der US-Regierung geprüfte Partner zugänglich. Die Benchmark-Zahlen sind sekundär gegenüber dem neuen Governance-Muster.