KPMG AI 報告 45 條引用只有 5 條是真的

去年 10 月，KPMG 發布了一份報告，標題叫做《Total Experience: Redefining Excellence in the Age of Agentic AI》。這份文件在顧問圈流傳，被多家媒體引用，幫助建立起 KPMG 在 AI 代理人領域的話語權。六月初，AI 內容偵測公司 GPTZero 對這份報告做了逐條查核，結論讓人很難看：45 條引用裡，只有 5 條能正確對應到真實來源。

其他 40 條，要嘛標題是杜撰的，要嘛來源被混搭拼接，要嘛根本查不到。GPTZero 的幻覺偵測工具把整份報告標記為「89% 引用有問題」，並直接判定報告本身「很可能由 AI 生成」。

什麼是「Vibe Citing」

GPTZero 為這個現象取了一個新名詞：vibe citing。意思是引用文獻的「氛圍引用」，對應去年已在程式圈流行的 vibe coding，也就是語言模型拼湊看起來像真實參考資料的假引用。作者名是假的，標題是假的，期刊是假的，但整體排版格式完全正確，乍看之下沒有問題。

差別在於：vibe coding 的結果最多是程式跑不起來，你馬上就知道出錯了。Vibe citing 的錯誤往往在報告傳播幾輪之後才被發現，中間這段時間已經有人根據假數據做了決策。

被假引用牽連的組織

KPMG 報告中虛構了多個知名企業和機構的 AI 導入案例：

報告聲稱 UBS 透過一個與微軟共同開發的平台，在投資諮詢、風控和合規監控三個領域部署了 AI 代理人。瑞銀公開回應：這些描述在事實上完全不正確。

NHS Greater Manchester、英國交通局 Transport for London 也被列為 AI 部署的成功案例，兩個機構均否認。

Emirates 的部分更荒謬：報告描述其聊天機器人 Sara 可以幫旅客更改航班，但 Sara 實際上是一台 2023 年推出的實體機器人，沒有訂位修改功能。

JR East 的問題是時間線對不上：報告引用了一份 2019 年的新聞稿，聲稱他們當時已在使用 AI 代理人。2019 年，這類技術在商業上根本還不存在。

奧地利能源公司 Verbund 的案例，則是把 Verbund 和一家它投資的新創混在一起，拼湊出一個 AI 管理家電的場景。

KPMG 的回應

報告被《金融時報》查核確認有問題後，KPMG 下架了這份文件，聲明正在「審查報告的發布經過」，並重申公司對「人工審核內容」的要求。

這個回應很規矩，但沒有回答核心問題：一份拿來建立市場信任的旗艦報告，在付梓前究竟有沒有人核查過引用？審查內容的規定是白紙黑字存在的，問題是有沒有被執行。

普華永道 Deloitte 不久前也出過類似的事：一份由澳洲政府出資委託的 AI 報告裡混進了 AI 生成內容，最後 Deloitte 退款了事。Big Four 的問題顯然不是個案。

傷害已經擴散

報告下架之前，KPMG 報告裡的虛假數據已經被多家行業媒體和一家捷克大報引用，進而被其他 AI 系統抓取作為訓練或檢索的來源。錯誤不只留在原始文件裡，已經進入更大的信息流。

這個問題的規模被低估了。一個顧問公司的錯誤報告，比一個創業公司的部落格文章傳播範圍更廣，因為品牌信任度讓人跳過了基本查核。GPTZero 創辦人 Edward Tian 警告，這是企業 AI 採用過程中被系統性忽視的風險：模型的輸出在沒有人認真核查的情況下，就這樣以顧問報告的包裝直接流通。

KPMG 賣的業務之一，就是協助企業建立 AI 治理框架。

如果這篇對你有幫助，訂閱電子報可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。

KPMG AI 報告 45 條引用只有 5 條是真的

什麼是「Vibe Citing」

被假引用牽連的組織

KPMG 的回應

傷害已經擴散

相關文章

OpenAI 收購 Ona：讓 Codex 代理程式連跑好幾天

GPT-5.6 發布了，但你用不到：美國政府審查正在重塑前沿 AI 模型的上市流程

什麼是「Vibe Citing」

被假引用牽連的組織

KPMG 的回應

傷害已經擴散

相關文章

OpenAI 收購 Ona：讓 Codex 代理程式連跑好幾天

GPT-5.6 發布了，但你用不到：美國政府審查正在重塑前沿 AI 模型的上市流程

訂閱最新分享