GPT-5.5-Cyber 正式發布:OpenAI 以 AI 找出 24 個 Linux 核心漏洞
重點摘要
OpenAI 於 6 月 22 日發布 GPT-5.5-Cyber,Daybreak 計畫已找出 24 個 Linux 核心漏洞、5 個 Chrome V8 可利用漏洞、10 個 Safari 漏洞。CyberGym 85.6% 的分數好看,但 ExploitGym 39.5% 才是那個讓 OpenAI 必須限制存取的真正原因。
這篇文章的數字幾乎全部來自 OpenAI 公開披露的成果,以及五個情報機構聯合聲明的背景資料。Daybreak 的審核程序和合作夥伴的實際使用模式,對外幾乎沒有第一手資料。如果你在資安廠商工作,或者你的公司申請過 Daybreak 存取權限,對這個審核門檻的觀察很想聽你說。申請流程有多嚴謹?拿到存取之後,實際的使用場景跟 OpenAI 發布稿的描述有多大落差?
六月二十二日,OpenAI 正式發布 GPT-5.5-Cyber,同時揭露 Daybreak 研究計畫半年來的完整成果清單。
Daybreak 的名字在業界已流傳數月,但這次是第一次附上具體的漏洞數字。公告列出的成果包括:24 個 Linux 核心本地提權漏洞、8 個核心指標資訊洩漏的概念驗證、34 個 FreeBSD 漏洞、6 個 dnsmasq 缺陷、5 個 Chrome V8 可利用漏洞、10 個 Apple Safari 可利用漏洞。所有漏洞已在公告前透過負責任揭露程序通知各軟體維護方。
伴隨 GPT-5.5-Cyber 的發布,OpenAI 同時宣布「Patch the Planet」計畫,與 Trail of Bits 和 HackerOne 合作,為 cURL、Go 語言、Python、Sigstore、aiohttp 等開源專案提供 AI 輔助漏洞掃描與修補服務。
OpenAI Daybreak 的攻守邏輯
GPT-5.5-Cyber 的設計目標是讓已驗證的防禦者能夠自動化執行漏洞發現、路徑追蹤、修補生成三個環節。更新後的 Codex Security 外掛支援從 SARIF 匯出到 CodeQL 整合的完整工作流程,針對大型程式碼庫提供深度掃描和威脅模型生成。
GPT-5.5-Cyber 的存取方式是明確限制的,只向通過 Daybreak 計畫審核的資安廠商和研究機構開放。確認的政府合作夥伴包括澳洲、加拿大、法國、德國、日本、南韓,以及歐盟網路安全局 ENISA。商業存取透過 25 家以上的 Daybreak 認證合作廠商進行。
Codex Security 外掛自三月預覽版上線以來,累計掃描超過三千萬個提交紀錄,涵蓋三萬個程式碼庫。OpenAI 官方發布頁面 揭露了兩個並列數字:五十萬個「自動處理的安全發現」,和七萬個「人工驗證的修補」。
數字背後的真相
CyberGym 是 OpenAI 自行建立的評估基準,目前沒有第三方獨立驗證。在這個前提下,GPT-5.5-Cyber 的 85.6% 對上 Anthropic Mythos 5 的 83.8%,差距是 1.8 個百分點。這個差距在沒有獨立複測之前,先當作兩個模型在能力上接近、而不是明確領先的信號來讀。
ExploitGym 的數字值得花更多時間看。39.5% 衡量的是模型在已知存在漏洞的目標上,成功生成可利用代碼的比率。從基礎版 GPT-5.5 的 25.95% 跳升到 39.5%,意味著每十次嘗試有將近四次能產出真正可執行的攻擊代碼。這個數字解釋了為什麼五個情報機構聯合聲明說,前沿 AI 模型正在「大幅壓縮漏洞披露到實際利用之間的時間窗口」。OpenAI 把存取權限鎖在 Daybreak 審核名單裡,ExploitGym 39.5% 給出了最直接的解釋。
五十萬個「自動處理的安全發現」配上七萬個「人工驗證的修補」,換算出的接受率約 14%。意思是每一百個 AI 生成的修補建議裡,大約有八十六個沒有通過人工審查。自動化壓縮了漏洞發現和初步分類的成本,但修補品質的最終判斷仍然落在人身上,這個比例現在是 AI 生成七成、人類決策九成。
掃描成本也可以粗估。三千萬個提交紀錄,每個差異按平均一千個 token 計算,是三百億 token 的輸入量。以 GPT-5.5 的推論定價換算,純掃描成本在十萬到二十萬美元之間。這讓「Patch the Planet」作為 OpenAI 統一運營的集中服務有其合理性,但也說明這個規模的工作量不是各個工程團隊自己常規跑得起來的。
傳統漏洞獎勵計畫的單個高危漏洞賞金在三萬到十五萬美元之間。5 個 Chrome V8 可利用漏洞和 10 個 Safari 可利用漏洞,換算成傳統市場估值,保守在五十萬美元以上。這批漏洞由 Daybreak 計畫系統性地找出,對 Google 和 Apple 漏洞獎勵計畫的定價邏輯,中期有沒有影響,是一個值得追蹤的問題。
接下來值得觀察的指標
Patch the Planet 計畫涵蓋 cURL、Go、Python,這三個專案加起來的每日下載量超過十億次。如果到 2026 年 Q3 末,這些專案中還沒有任何一個在 CVE 公告裡明確標注由 GPT-5.5-Cyber 輔助發現,說明計畫的推進速度比發布當天的措辭更謹慎,或者「AI 輔助發現」的定義在法律層面還在協商。
Daybreak 的政府合作夥伴目前的名單裡,沒有包含任何一個亞洲以外的中等技術國家,也沒有任何中東安全機構。首次有非 G7 國家加入的時間點和名單擴張速度,是評估 OpenAI 在地緣政治資安合作上佈局的具體指標,比任何官方聲明都更直接。
Google 和 Apple 對這批 Daybreak 揭露漏洞的修補周期長短,是第三個可以量化的觀察點。兩家公司的安全公告應該會出現對應的 CVE 編號和致謝聲明。如果修補周期比各自的歷史平均響應時間更長,可能說明 AI 發現漏洞的速度已超過傳統修補流程的吸收能力。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
相關閱讀