Anthropic Mythos:AI 自主挖漏洞的能力正在超越人類修補的速度
重點摘要
Anthropic Mythos Preview 在 Firefox 單項測試產出 181 個有效 exploit,前代 Opus 4.6 只有 2 個。Project Glasswing 現擴展至 200 家機構,含北約和歐盟資安局,但六千個嚴重漏洞中只有 75 個完成修補。
Anthropic Mythos Preview 是 Anthropic 目前最強的模型,但你在任何公開 API 上都找不到它。六月二日,Anthropic 宣布將 Mythos 的存取權擴展至 150 個新機構,加上最初的約 50 個合作夥伴,Project Glasswing 框架下的受訪機構總數達到約 200 個。新進名單裡有北約、三星、Okta,以及歐盟網路安全局 ENISA。
這 150 個新機構橫跨 15 個以上國家,集中在電力、水利、醫療、通訊和硬體供應鏈五個領域,幾乎所有成員的共同特徵是:一旦遭到有效攻擊,受波及人口超過一億。
Mythos 在 Firefox 測試中成功 181 次,前代只有 2 次
讓 Anthropic 決定限制存取的原因,是 Mythos 的漏洞利用能力跟前幾代比起來有本質上的差異。
Firefox 漏洞測試最直接。研究人員讓 Mythos Preview 和前代 Opus 4.6 各自對同一批 Firefox 漏洞樣本嘗試寫出可用的 JavaScript shell exploit。Opus 4.6 在數百次嘗試後只成功兩次,Mythos Preview 成功了 181 次。OSS-Fuzz 控制流劫持的測試結果類似,Opus 4.6 完成一個目標,Mythos 完成十個。
CyberGym 基準測試的數字是 83.1% 對 66.6%,表面差距不算誇張,但實際攻擊成功率落差是數十倍。Anthropic 在技術報告裡點出一個值得注意的事實:這些能力並非刻意針對資安進行訓練的結果,而是「代碼能力、推理能力和自主性普遍提升後的附帶效果」,等於說資安攻擊能力是通用智能升級時不請自來的副產品。
截至目前,Mythos 在 Glasswing 框架內已找出超過兩萬三千個潛在漏洞,其中估計超過六千個會被確認為嚴重缺陷。實際已完成修補的數量是 75 個。AI 找漏洞的速度已經遠遠超過工程師修漏洞的速度,這個缺口才是 Glasswing 計畫現在最核心的摩擦點。
Project Glasswing 的十二家創始成員與資金承諾
Project Glasswing 由十二家機構聯合發起,包含 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks,以及 Anthropic 本身。資金承諾包含一億美元的模型使用額度,加上四百萬美元捐給開源安全組織。
Mythos 在實際部署中找到的幾個案例說明了這個計畫為何針對的是「老問題」:OpenBSD 裡一個存在 27 年的遠端崩潰漏洞,FFmpeg 裡一個已躲過五百萬次自動測試的 16 年老洞,以及多個 Linux 核心的權限提升漏洞。這些漏洞在人力和傳統自動化工具下長期被忽略,Mythos 用自主推理的方式把它們翻出來。更多細節可參考 Anthropic 的 Project Glasswing 官方頁面。
Anthropic 為何選擇不全面開放
Anthropic 在官方聲明中明確表示,Mythos Preview「不打算全面開放」。一個能在幾分鐘內對主流軟體寫出 RCE exploit 的模型,若以普通 API 形式釋出,攻擊工具的門檻會降到接近零,這是 Anthropic 公開說不的理由。
他們選的路是把存取權給有能力負責任地使用它的機構,搭配主動修補的協調機制。北約和 ENISA 的加入,讓 Glasswing 的框架多了一個政府主導的跨國防衛層,覆蓋範圍從科技公司延伸到國家基礎設施。
根據 SecurityWeek 的報導,Anthropic 目前也在研究如何讓漏洞揭露報告更容易被開源維護者接受,試圖從流程層面加速那 75 個以外的修補進度。
六千個嚴重漏洞,75 個修好。下一個要解決的問題,可能已經跑到「AI 能不能協助自動化修補工作」了。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
相關文章
Project Fetch Phase 2:Claude Opus 4.7 寫機器狗程式快了 37 倍,球還是沒撿到
Anthropic 的 Project Fetch Phase 2 顯示,Claude Opus 4.7 自主撰寫四足機器人控制程式碼的速度比無 AI 輔助的人類快了 37.7 倍,程式碼量也僅需人類的十分之一。機器狗最終沒有撿到球。這個結果既是里程碑,也是邊界的精準標示。
AlphaFold 諾貝爾獎得主 John Jumper 離開 Google DeepMind,加入 Anthropic
AlphaFold 共同開發者、2024 年諾貝爾化學獎得主 John Jumper 宣布離開 Google DeepMind,加入 Anthropic。在 AI 人才爭奪戰激烈化的當下,這是繼 Noam Shazeer 後又一名頂尖研究員出走 Google,轉投競爭對手懷抱。