← Zurück zu Einblicke

KPMG-KI-Bericht: 40 von 45 Zitaten erfunden — GPTZero prägt den Begriff "Vibe Citing"

Nils Liu
KPMG AI 幻覺 vibe citing 企業 AI GPTZero AI 治理 Nachrichten

Kurzfassung

GPTZeros forensische Analyse von KPMGs KI-Bericht ergab, dass 40 von 45 Zitiertiteln erfunden und 89 % der Zitate fehlerhaft waren. UBS, NHS und Transport for London dementierten die Behauptungen. KPMG zog den Bericht zurück.

KPMG-KI-Bericht: 40 von 45 Zitaten erfunden — GPTZero prägt den Begriff "Vibe Citing"

Im Oktober 2025 veröffentlichte KPMG einen Bericht mit dem Titel Total Experience: Redefining Excellence in the Age of Agentic AI. Das Dokument kursierte in Beraterkreisen, wurde von mehreren Fachpublikationen zitiert und half KPMG dabei, eine Marktposition im Bereich agentischer KI aufzubauen. Anfang Juni 2026 schloss das KI-Erkennungsunternehmen GPTZero eine forensische Überprüfung des Berichts ab. Das Ergebnis: Von 45 Zitaten verwiesen nur 5 auf echte Quellen.

Die übrigen 40 reichten von vollständig erfundenen Titeln bis hin zu zusammengesetzten Fälschungen aus mehreren realen Quellen. GPTZeros Halluzinations-Tool stufte 89 Prozent der Zitate als fehlerhaft ein und bewertete das Dokument selbst als “wahrscheinlich KI-generiert.”

Was ist “Vibe Citing”

GPTZero prägte für das Phänomen den Begriff Vibe Citing, in Anlehnung an Vibe Coding, das unkritische Übernehmen von KI-generiertem Code ohne eigenes Verständnis. Beim Vibe Citing erzeugt ein Sprachmodell Quellenangaben, die formal korrekt aussehen, aber auf nichts Reales verweisen: plausible Autorennamen, erfundene Zeitschriftentitel, korrektes Zitierformat.

Der entscheidende Unterschied zu Vibe Coding liegt in der Erkennungsgeschwindigkeit. Fehlerhafter Code fällt sofort auf, wenn das Programm nicht läuft. Fehlerhafte Zitate zirkulieren wochenlang, bis jemand nachschlägt. In der Zwischenzeit werden sie in Sekundärquellen übernommen, von anderen KI-Systemen verarbeitet und verbreiten sich durch die gesamte Informationskette.

Die genannten Organisationen

KPMGs Bericht enthielt frei erfundene KI-Fallstudien bekannter Institutionen:

UBS wurde als Unternehmen beschrieben, das KI-Agenten für Anlageberatung, Risikomanagement und Compliance-Überwachung über eine gemeinsam mit Microsoft entwickelte Plattform einsetzt. Ein UBS-Sprecher erklärte der Financial Times, die Aussagen seien sachlich falsch.

NHS Greater Manchester und Transport for London wurden beide als KI-Erfolgsbeispiele aufgeführt. Beide Organisationen dementierten.

Das Emirates-Beispiel war besonders irreführend: Der Bericht behauptete, der Chatbot Sara der Fluggesellschaft könne Buchungen ändern. Sara ist tatsächlich ein 2023 vorgestellter physischer Roboter ohne Buchungsverwaltungsfunktion.

JR East wurde mit einer Pressemitteilung aus dem Jahr 2019 als Beweis für den agentischen KI-Einsatz angeführt. 2019 existierte kommerzielle agentische KI noch nicht.

Beim österreichischen Energieunternehmen Verbund wurden die Identität des Konzerns und die eines Beteiligungsunternehmens vermischt, was zu einer fiktiven Fallstudie über KI-gesteuerte Haushaltsgeräte führte.

KPMGs Reaktion

Nachdem die Financial Times GPTZeros Ergebnisse bestätigte, zog KPMG den Bericht zurück und erklärte, man prüfe “die Umstände der Veröffentlichung” und bekräftige die unternehmensinternen Anforderungen an menschliche Überprüfung von Inhalten.

Die naheliegende Frage blieb unbeantwortet: Wenn die Überprüfungspflicht bereits zum Veröffentlichungszeitpunkt galt, warum wurden die Zitate dann nicht geprüft? Die Richtlinie existierte auf dem Papier. Ob sie angewendet wurde, ist eine andere Frage.

Das Muster beschränkt sich nicht auf KPMG. Deloitte erstattet der australischen Regierung kürzlich den Betrag für einen Bericht, in dem KI-generierte Inhalte aufgetaucht waren. Unter den Big Four scheint das Problem strukturell zu sein.

Der Schaden hat sich bereits verbreitet

Bevor KPMG den Bericht zurückzog, wurden seine erfundenen Statistiken bereits in mehreren Fachpublikationen und mindestens einer tschechischen Tageszeitung zitiert. Diese Sekundärquellen wurden anschließend von anderen KI-Systemen als Referenzmaterial verarbeitet, was die falschen Behauptungen weiter verbreitete.

GPTZero-Gründer Edward Tian bezeichnet dies als systematisch unterschätztes Risiko bei der Einführung von KI im Unternehmensbereich: Das Problem liegt nicht darin, dass Modelle Fehler machen, sondern dass Modellausgaben in großem Maßstab ohne angemessene menschliche Überprüfung verbreitet werden. Berichte einer Big-Four-Unternehmensberatung genießen genug institutionelles Vertrauen, dass Leser die Quellenprüfung schlicht überspringen.

KPMG gehört zu den Beratungsunternehmen, die Enterprise-Kunden KI-Governance-Frameworks verkaufen.

Wenn dieser Artikel hilfreich war, abonniere den Newsletter für wöchentliche KI-PM-Einblicke.

Verwandt: Claude Fable 5 veröffentlicht: Anthropics erster Schachzug gegen GPT-5

Abonnieren Sie die neuesten Erkenntnisse

Abonnieren Sie den Newsletter, um meine neuesten Artikel über AI Agents in Finanzinstituten, GenAI und Architektur zu erhalten.

Kein Spam. Jederzeit kündbar.