← 返回文章列表

Anthropic Mythos:AI 自主挖漏洞的能力正在超越人類修補的速度

Nils Liu
Anthropic AI資安 網路安全 新聞觀察 大型語言模型

重點摘要

Anthropic Mythos Preview 在 Firefox 單項測試產出 181 個有效 exploit,前代 Opus 4.6 只有 2 個。Project Glasswing 現擴展至 200 家機構,含北約和歐盟資安局,但六千個嚴重漏洞中只有 75 個完成修補。

Anthropic Mythos:AI 自主挖漏洞的能力正在超越人類修補的速度

Anthropic Mythos Preview 是 Anthropic 目前最強的模型,但你在任何公開 API 上都找不到它。六月二日,Anthropic 宣布將 Mythos 的存取權擴展至 150 個新機構,加上最初的約 50 個合作夥伴,Project Glasswing 框架下的受訪機構總數達到約 200 個。新進名單裡有北約、三星、Okta,以及歐盟網路安全局 ENISA。

這 150 個新機構橫跨 15 個以上國家,集中在電力、水利、醫療、通訊和硬體供應鏈五個領域,幾乎所有成員的共同特徵是:一旦遭到有效攻擊,受波及人口超過一億。

Mythos 在 Firefox 測試中成功 181 次,前代只有 2 次

讓 Anthropic 決定限制存取的原因,是 Mythos 的漏洞利用能力跟前幾代比起來有本質上的差異。

Firefox 漏洞測試最直接。研究人員讓 Mythos Preview 和前代 Opus 4.6 各自對同一批 Firefox 漏洞樣本嘗試寫出可用的 JavaScript shell exploit。Opus 4.6 在數百次嘗試後只成功兩次,Mythos Preview 成功了 181 次。OSS-Fuzz 控制流劫持的測試結果類似,Opus 4.6 完成一個目標,Mythos 完成十個。

CyberGym 基準測試的數字是 83.1% 對 66.6%,表面差距不算誇張,但實際攻擊成功率落差是數十倍。Anthropic 在技術報告裡點出一個值得注意的事實:這些能力並非刻意針對資安進行訓練的結果,而是「代碼能力、推理能力和自主性普遍提升後的附帶效果」,等於說資安攻擊能力是通用智能升級時不請自來的副產品。

截至目前,Mythos 在 Glasswing 框架內已找出超過兩萬三千個潛在漏洞,其中估計超過六千個會被確認為嚴重缺陷。實際已完成修補的數量是 75 個。AI 找漏洞的速度已經遠遠超過工程師修漏洞的速度,這個缺口才是 Glasswing 計畫現在最核心的摩擦點。

Project Glasswing 的十二家創始成員與資金承諾

Project Glasswing 由十二家機構聯合發起,包含 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks,以及 Anthropic 本身。資金承諾包含一億美元的模型使用額度,加上四百萬美元捐給開源安全組織。

Mythos 在實際部署中找到的幾個案例說明了這個計畫為何針對的是「老問題」:OpenBSD 裡一個存在 27 年的遠端崩潰漏洞,FFmpeg 裡一個已躲過五百萬次自動測試的 16 年老洞,以及多個 Linux 核心的權限提升漏洞。這些漏洞在人力和傳統自動化工具下長期被忽略,Mythos 用自主推理的方式把它們翻出來。更多細節可參考 Anthropic 的 Project Glasswing 官方頁面

Anthropic 為何選擇不全面開放

Anthropic 在官方聲明中明確表示,Mythos Preview「不打算全面開放」。一個能在幾分鐘內對主流軟體寫出 RCE exploit 的模型,若以普通 API 形式釋出,攻擊工具的門檻會降到接近零,這是 Anthropic 公開說不的理由。

他們選的路是把存取權給有能力負責任地使用它的機構,搭配主動修補的協調機制。北約和 ENISA 的加入,讓 Glasswing 的框架多了一個政府主導的跨國防衛層,覆蓋範圍從科技公司延伸到國家基礎設施。

根據 SecurityWeek 的報導,Anthropic 目前也在研究如何讓漏洞揭露報告更容易被開源維護者接受,試圖從流程層面加速那 75 個以外的修補進度。

六千個嚴重漏洞,75 個修好。下一個要解決的問題,可能已經跑到「AI 能不能協助自動化修補工作」了。

如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。

訂閱最新分享

加入電子報,第一時間獲取關於金融 AI Agent 實戰與架構設計的最新文章。不訂閱你會慢別人一個週期!

絕不發送垃圾信。隨時皆可取消訂閱。