KPMG AI 報告 45 條引用只有 5 條是真的
重點摘要
KPMG 一份宣揚 AI 代理人的報告,被 GPTZero 發現 40 條引用標題根本不存在。UBS、NHS、英國交通局都被假引用牽連,報告已下架,諮詢公司銷售 AI 治理服務時,自己報告的可信度先出了問題。
去年 10 月,KPMG 發布了一份報告,標題叫做《Total Experience: Redefining Excellence in the Age of Agentic AI》。這份文件在顧問圈流傳,被多家媒體引用,幫助建立起 KPMG 在 AI 代理人領域的話語權。六月初,AI 內容偵測公司 GPTZero 對這份報告做了逐條查核,結論讓人很難看:45 條引用裡,只有 5 條能正確對應到真實來源。
其他 40 條,要嘛標題是杜撰的,要嘛來源被混搭拼接,要嘛根本查不到。GPTZero 的幻覺偵測工具把整份報告標記為「89% 引用有問題」,並直接判定報告本身「很可能由 AI 生成」。
什麼是「Vibe Citing」
GPTZero 為這個現象取了一個新名詞:vibe citing。意思是引用文獻的「氛圍引用」,對應去年已在程式圈流行的 vibe coding,也就是語言模型拼湊看起來像真實參考資料的假引用。作者名是假的,標題是假的,期刊是假的,但整體排版格式完全正確,乍看之下沒有問題。
差別在於:vibe coding 的結果最多是程式跑不起來,你馬上就知道出錯了。Vibe citing 的錯誤往往在報告傳播幾輪之後才被發現,中間這段時間已經有人根據假數據做了決策。
被假引用牽連的組織
KPMG 報告中虛構了多個知名企業和機構的 AI 導入案例:
報告聲稱 UBS 透過一個與微軟共同開發的平台,在投資諮詢、風控和合規監控三個領域部署了 AI 代理人。瑞銀公開回應:這些描述在事實上完全不正確。
NHS Greater Manchester、英國交通局 Transport for London 也被列為 AI 部署的成功案例,兩個機構均否認。
Emirates 的部分更荒謬:報告描述其聊天機器人 Sara 可以幫旅客更改航班,但 Sara 實際上是一台 2023 年推出的實體機器人,沒有訂位修改功能。
JR East 的問題是時間線對不上:報告引用了一份 2019 年的新聞稿,聲稱他們當時已在使用 AI 代理人。2019 年,這類技術在商業上根本還不存在。
奧地利能源公司 Verbund 的案例,則是把 Verbund 和一家它投資的新創混在一起,拼湊出一個 AI 管理家電的場景。
KPMG 的回應
報告被《金融時報》查核確認有問題後,KPMG 下架了這份文件,聲明正在「審查報告的發布經過」,並重申公司對「人工審核內容」的要求。
這個回應很規矩,但沒有回答核心問題:一份拿來建立市場信任的旗艦報告,在付梓前究竟有沒有人核查過引用?審查內容的規定是白紙黑字存在的,問題是有沒有被執行。
普華永道 Deloitte 不久前也出過類似的事:一份由澳洲政府出資委託的 AI 報告裡混進了 AI 生成內容,最後 Deloitte 退款了事。Big Four 的問題顯然不是個案。
傷害已經擴散
報告下架之前,KPMG 報告裡的虛假數據已經被多家行業媒體和一家捷克大報引用,進而被其他 AI 系統抓取作為訓練或檢索的來源。錯誤不只留在原始文件裡,已經進入更大的信息流。
這個問題的規模被低估了。一個顧問公司的錯誤報告,比一個創業公司的部落格文章傳播範圍更廣,因為品牌信任度讓人跳過了基本查核。GPTZero 創辦人 Edward Tian 警告,這是企業 AI 採用過程中被系統性忽視的風險:模型的輸出在沒有人認真核查的情況下,就這樣以顧問報告的包裝直接流通。
KPMG 賣的業務之一,就是協助企業建立 AI 治理框架。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。