美國政府下令關閉 Claude Fable 5:一個 Jailbreak 示範如何讓最強 AI 模型在三天後被迫下架
重點摘要
Claude Fable 5 上線三天後,美國商務部以國安理由發出出口管制令,Anthropic 被迫對全球用戶關閉服務。觸發點是一個 Unicode 同形字 Jailbreak 示範,洩露的系統提示長達 12 萬字元。
六月九日,Anthropic 公開推出 Claude Fable 5 和 Claude Mythos 5,Mythos 等級模型首次向一般大眾開放。三天後的六月十二日下午 5 點 21 分,Anthropic 收到美國商務部長 Howard Lutnick 發出的出口管制令,被迫在數小時內對全球所有用戶關閉這兩個模型的存取,成為 AI 史上首次有政府以國家安全為由強制下架已公開上線前沿模型的案例。
三天從發布到關閉
Fable 5 的公開上線本身就已是重大里程碑。Anthropic 把 Mythos 等級的能力包裝進一個有額外安全護欄的版本,向大眾開放,Pro 和 Max 方案用戶在六月二十二日前免費使用。定價定在每百萬 token 輸入 $10、輸出 $50,比起 Opus 4.8 還貴一個數量級。
模型發布後隔天,六月十日,一位化名「Pliny the Liberator」的匿名研究者在 X 上發布了一系列 Jailbreak 示範,展示如何用 Unicode 替換、同形字和字元分解技術繞過 Fable 5 的安全分類器。他把完整的 12 萬字元系統提示上傳至 GitHub,其中包含攻擊者可用的棧緩衝區溢位利用指引,以及合成甲基苯丙胺的步驟。
更關鍵的是,有另一個尚未公開的組織聲稱掌握了類似方法,並向政府官員通報,直接觸發了關閉令。
政府令和 Anthropic 的回應
Anthropic 在官方聲明中描述,商務部的指令要求「禁止任何外國公民存取 Fable 5 和 Mythos 5,無論其身處美國境內或境外,包含 Anthropic 自身的外籍員工」。為確保合規,公司唯一的選擇是對所有客戶一併關閉。
Anthropic 明確表示不同意這項決定。公司的技術評估指出,這個 Jailbreak 方式只能複現「少量已知的、程度較輕的漏洞」,而且這些漏洞在競爭對手的模型(包括 GPT-5.5)中同樣存在。Anthropic 在聲明中直接點出:若政府以這個標準對整個 AI 產業執行,結果將「實際上叫停所有新模型的部署」。
截至六月十五日,Fable 5 和 Mythos 5 的存取仍然暫停,Anthropic 表示正努力恢復,但沒有給出具體時間表。其餘 Claude 模型,包括 Opus 4.8、Sonnet 4.6 和 Haiku 4.5,一切運作正常。
企業端的「硬體主權」反應
Fable 5 關閉後,開發者社群出現了一波顯著的轉向。討論串里大量出現「在本地 GPU 上跑開源模型」的號召,Kimi K2.7 Code 等開源權重替代方案一夜之間成為話題中心。核心邏輯很簡單:如果你的工作流依賴雲端 API,政府一紙指令就能讓你的系統在幾小時內失靈。
這種「硬體主權」的討論,不是因為工程師忽然對技術細節感興趣了。Fable 5 停用事件把一個一直被刻意迴避的問題擺到了桌面上:在 AI 能力快速前進的 2026 年,誰真正控制著企業最關鍵的 AI 基礎設施?
Anthropic 本身也面臨一個微妙的處境,六月三日他們剛秘密向 SEC 遞交了 S-1,正在準備以約 9,650 億美元的估值上市。Fable 5 是帶動新一輪收入成長的重要棋子,被迫下架的每一天都有實際的財務成本。
監管邏輯的邊界在哪裡
這件事值得深究,因為它揭示了一種監管模式正在成形,而且這個模式來得比大多數人預期的都快。
出口管制原本針對的是晶片、硬體,用來限制技術的物理流動。現在這套邏輯被套用在軟體模型上,且執行速度極快,在不提供技術細節的情況下,要求公司在幾小時內全球停止服務。Anthropic 不同意,但還是照做了,因為法律義務沒有回旋空間。
Digital Watch Observatory 的分析指出,這和歐盟的風險導向監管框架形成明顯對比。歐洲的做法傾向事前評估和持續稽核,美國這次的作法是在沒有技術說明的情況下要求緊急關閉。
下一步可能出現兩種情境:Anthropic 快速修補後在幾天內復原,這個事件成為政府和 AI 公司之間安全評估流程的一次強制演習。或者恢復時間拉長,談判過程公開化,進而推動美國 AI 監管框架正式化的討論提前到來。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
延伸閱讀:
相關文章
Project Fetch Phase 2:Claude Opus 4.7 寫機器狗程式快了 37 倍,球還是沒撿到
Anthropic 的 Project Fetch Phase 2 顯示,Claude Opus 4.7 自主撰寫四足機器人控制程式碼的速度比無 AI 輔助的人類快了 37.7 倍,程式碼量也僅需人類的十分之一。機器狗最終沒有撿到球。這個結果既是里程碑,也是邊界的精準標示。
AI主權警報:Carney在G7把Fable 5斷供比作2008金融危機
美國商務部一張出口管制令讓 Fable 5 全球斷線,加拿大總理 Mark Carney 在 G7 峰會把這次事件比作 2008 金融危機的系統性風險,呼籲建立 AI 主權基礎設施。一張行政命令就能讓全球用戶斷線,這個風險該由誰承擔?