OpenAI 首款自研晶片 Jalapeño 亮相:九個月打造,推論端不再全靠輝達
重點摘要
OpenAI 與 Broadcom 聯手揭露 Jalapeño,OpenAI 第一顆自研推論 ASIC,九個月從設計到 tape-out,用自家 AI 模型協助晶片設計,目標 2026 年底部署。這場佈局的核心是推論端成本重組,不是要幹掉輝達。
我的立場先說清楚:Jalapeño 三年內不會讓 NVIDIA 在推論端失去定價權,原因是模型架構每隔幾個月就翻新,通用 GPU 的靈活性對快速迭代的 OpenAI 反而是隱形護城河。但如果你在半導體設計或資料中心基礎設施工作,對 ASIC 的可程式性問題有不同的第一手觀察,很想聽你打臉。
六月二十四日,OpenAI 與 Broadcom 聯合宣布:Jalapeño 正式亮相,這是 OpenAI 第一顆自研 AI 晶片,定位在推論加速器,不是訓練用的通用 GPU。
晶片樣品已交到 OpenAI 執行長 Sam Altman 和總裁 Greg Brockman 手上,由 Broadcom 執行長 Hock Tan 和總裁 Charlie Kawwas 親自送達。目前樣品已在目標頻率和功耗下跑通 GPT-5.3-Codex-Spark 的推論工作負載,計畫在 2026 年底完成初步生產部署。
Jalapeño 在做什麼
根據 TechCrunch 和 Broadcom 投資人關係頁面的聯合公告,Jalapeño 是針對 LLM 推論工作負載設計的 ASIC,架構重點放在幾個 LLM 推論的實際瓶頸:資料搬移成本、算力與記憶體頻寬的平衡、網路互連效率。
Brockman 在聲明中說:「我們非常了解自己的工作負載,一直在尋找那些被現有硬體低估服務的推論場景。」
開發合作的分工是:OpenAI 負責架構設計與 AI 輔助最佳化,Broadcom 負責矽片實現、網路連線技術,Celestica 負責電路板、機架與系統整合。
數字背後的真相
九個月開發週期:比想像中更複雜
「九個月從設計到 tape-out」這個數字在業界引發熱議。高性能 ASIC 的正常週期是 24 到 36 個月。Jalapeño 能壓縮到九個月,有三個可能原因:Broadcom 在自定義 ASIC 合作上重用了大量既有 IP;OpenAI 的 AI 模型確實加速了 EDA 工具的最佳化流程;或者架構選擇刻意降低了設計複雜度來換取開發速度。
三個原因可能同時成立,但媒體普遍跳過第一和第三點,只放大「AI 設計了自己跑的晶片」的敘事。
效能數字還沒有第三方驗證
「性能功耗比優於當前最先進替代品」這句話來自 OpenAI 自家的測試結果,目前沒有獨立機構驗證。晶片連生產都還沒上,說「比 H200 強」還早。
值得放進費米估算的數字是 Broadcom 的財務預測:第三季 AI 晶片營收預測達 160 億美元,全長期目標 1000 億美元。Jalapeño 如果能成為多代平台的起點,單 OpenAI 一個客戶就能讓 Broadcom 的 AI 晶片收入結構更穩。
為什麼是推論,不是訓練
OpenAI 公告明確指出:預訓練等高強度任務仍然繼續使用 NVIDIA 硬體。這是理性的選擇,不是妥協。LLM 訓練對架構可程式性的要求遠高於推論,而 ChatGPT 每天處理的數億次請求,幾乎全部是推論。
把推論工作負載轉到自研晶片,對 OpenAI 的財務意義是:如果推論成本佔總算力支出的 40% 以上,哪怕效率提升 15%,每年都能省下數億美元規模的運算費用。
接下來值得觀察的具體指標
六個月內有三個可驗證的結果值得盯:
第一,ChatGPT API 定價。如果 Jalapeño 在 2026 年底如期部署,2027 年初的 API 每百萬 token 價格應該出現可量測的下降。OpenAI 過去降價都在基礎設施成本下降後幾個季度發生,這次可以作為校準基準。
第二,Broadcom 的 AI 晶片客戶集中度。Broadcom Q3 法說會如果出現「策略性大客戶」的合約能見度增加,Jalapeño 的規模部署計畫就有外部佐證。
第三,模型架構與晶片週期的錯位風險。OpenAI 每半年就推出新的推論架構,而 ASIC 的設計週期即便壓縮到九個月,重新 tape-out 的成本仍然高得多。如果 2027 年的推論架構和 Jalapeño 的設計假設出現明顯落差,才是這個「Apple 式全棧策略」真正的壓力測試。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
延伸閱讀: