OpenAI 首款自研晶片 Jalapeño 亮相：九個月打造，推論端不再全靠輝達

我的立場先說清楚：Jalapeño 三年內不會讓 NVIDIA 在推論端失去定價權，原因是模型架構每隔幾個月就翻新，通用 GPU 的靈活性對快速迭代的 OpenAI 反而是隱形護城河。但如果你在半導體設計或資料中心基礎設施工作，對 ASIC 的可程式性問題有不同的第一手觀察，很想聽你打臉。

六月二十四日，OpenAI 與 Broadcom 聯合宣布：Jalapeño 正式亮相，這是 OpenAI 第一顆自研 AI 晶片，定位在推論加速器，不是訓練用的通用 GPU。

晶片樣品已交到 OpenAI 執行長 Sam Altman 和總裁 Greg Brockman 手上，由 Broadcom 執行長 Hock Tan 和總裁 Charlie Kawwas 親自送達。目前樣品已在目標頻率和功耗下跑通 GPT-5.3-Codex-Spark 的推論工作負載，計畫在 2026 年底完成初步生產部署。

Jalapeño 在做什麼

根據 TechCrunch 和 Broadcom 投資人關係頁面的聯合公告，Jalapeño 是針對 LLM 推論工作負載設計的 ASIC，架構重點放在幾個 LLM 推論的實際瓶頸：資料搬移成本、算力與記憶體頻寬的平衡、網路互連效率。

Brockman 在聲明中說：「我們非常了解自己的工作負載，一直在尋找那些被現有硬體低估服務的推論場景。」

開發合作的分工是：OpenAI 負責架構設計與 AI 輔助最佳化，Broadcom 負責矽片實現、網路連線技術，Celestica 負責電路板、機架與系統整合。

數字背後的真相

九個月開發週期：比想像中更複雜

「九個月從設計到 tape-out」這個數字在業界引發熱議。高性能 ASIC 的正常週期是 24 到 36 個月。Jalapeño 能壓縮到九個月，有三個可能原因：Broadcom 在自定義 ASIC 合作上重用了大量既有 IP；OpenAI 的 AI 模型確實加速了 EDA 工具的最佳化流程；或者架構選擇刻意降低了設計複雜度來換取開發速度。

三個原因可能同時成立，但媒體普遍跳過第一和第三點，只放大「AI 設計了自己跑的晶片」的敘事。

效能數字還沒有第三方驗證

「性能功耗比優於當前最先進替代品」這句話來自 OpenAI 自家的測試結果，目前沒有獨立機構驗證。晶片連生產都還沒上，說「比 H200 強」還早。

值得放進費米估算的數字是 Broadcom 的財務預測：第三季 AI 晶片營收預測達 160 億美元，全長期目標 1000 億美元。Jalapeño 如果能成為多代平台的起點，單 OpenAI 一個客戶就能讓 Broadcom 的 AI 晶片收入結構更穩。

為什麼是推論，不是訓練

OpenAI 公告明確指出：預訓練等高強度任務仍然繼續使用 NVIDIA 硬體。這是理性的選擇，不是妥協。LLM 訓練對架構可程式性的要求遠高於推論，而 ChatGPT 每天處理的數億次請求，幾乎全部是推論。

把推論工作負載轉到自研晶片，對 OpenAI 的財務意義是：如果推論成本佔總算力支出的 40% 以上，哪怕效率提升 15%，每年都能省下數億美元規模的運算費用。

接下來值得觀察的具體指標

六個月內有三個可驗證的結果值得盯：

第一，ChatGPT API 定價。如果 Jalapeño 在 2026 年底如期部署，2027 年初的 API 每百萬 token 價格應該出現可量測的下降。OpenAI 過去降價都在基礎設施成本下降後幾個季度發生，這次可以作為校準基準。

第二，Broadcom 的 AI 晶片客戶集中度。Broadcom Q3 法說會如果出現「策略性大客戶」的合約能見度增加，Jalapeño 的規模部署計畫就有外部佐證。

第三，模型架構與晶片週期的錯位風險。OpenAI 每半年就推出新的推論架構，而 ASIC 的設計週期即便壓縮到九個月，重新 tape-out 的成本仍然高得多。如果 2027 年的推論架構和 Jalapeño 的設計假設出現明顯落差，才是這個「Apple 式全棧策略」真正的壓力測試。

如果這篇對你有幫助，訂閱電子報可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。

延伸閱讀：

OpenAI 首款自研晶片 Jalapeño 亮相：九個月打造，推論端不再全靠輝達

Jalapeño 在做什麼

數字背後的真相

九個月開發週期：比想像中更複雜

效能數字還沒有第三方驗證

為什麼是推論，不是訓練

接下來值得觀察的具體指標

相關文章

GPT-5.5 正式發布：14 項基準測試奪冠，黃仁勳砸百億美元押注算力

GPT-5.6 發布了，但你用不到：美國政府審查正在重塑前沿 AI 模型的上市流程

Jalapeño 在做什麼

數字背後的真相

九個月開發週期：比想像中更複雜

效能數字還沒有第三方驗證

為什麼是推論，不是訓練

接下來值得觀察的具體指標

相關文章

GPT-5.5 正式發布：14 項基準測試奪冠，黃仁勳砸百億美元押注算力

GPT-5.6 發布了，但你用不到：美國政府審查正在重塑前沿 AI 模型的上市流程

訂閱最新分享