DeepSeek V4-Pro API 永久降價 75%，每百萬輸出 Token 只需 $0.87，比 GPT-5.5 便宜 34 倍

DeepSeek 5 月 22 日宣布，原定 5 月 31 日到期的 V4-Pro API 折扣不會過期了。75% 折扣從促銷變成常態定價，輸出 Token 每百萬 $0.87、輸入 $0.435、快取命中更只要 $0.003625。這個數字比 GPT-5.5 便宜 34 倍，已經不是促銷可以解釋的價差。

降幅的實際量級

舊定價是輸入 $1.74 每百萬、輸出 $3.48 每百萬。新定價把兩個數字各縮到四分之一，快取命中的折扣更大，部分場景跌到原價的十分之一。對於每天呼叫 API 幾千萬次的工程團隊，這直接是帳單金額少了七八成。

V4-Pro 的架構是混合專家（MoE），1.6 兆總參數，每次任務實際啟動約 490 億參數，支援 100 萬 Token 的上下文視窗。按效能指標，這個等級跟 GPT-5.5 和 Claude Opus 4.7 在同一個競技場。同等性能、四分之一價，這個落差不會隨著時間自然收斂。

成本能壓低的兩個結構性因素

關鍵在硬體選擇。V4-Pro 從一開始就針對華為昇騰 950PR 晶片優化，不依賴 Nvidia GPU。這讓 DeepSeek 的推論成本結構跟 OpenAI、Anthropic 截然不同，西方廠商仍在支付 H100/H200 的高價，DeepSeek 繞開了這條路。Counterpoint Research 分析師 Wei Sun 指出，昇騰 950 系列量產加速是 DeepSeek 能維持低價的結構性因素，今年預計相關系統出貨量是去年的 2.5 倍。

第二個因素是架構效率。MoE 設計讓模型在每次推論時只啟動參數總量的約 3%，大幅降低每個 Token 的算力消耗。硬體繞開了 Nvidia 的議價權，架構壓低了算力本身的需求，兩條路同時走，才壓得出 34 倍的價差。

開發者黏性才是真正目的

有 AI 基礎設施分析師把這個定價策略比作 2006 年的 AWS。當年 Amazon 用接近虧損的定價拿下雲端市場，等開發者系統全跑在 AWS 上再說別的。後來十年的雲端市場就是被這套策略定形的。

DeepSeek 現在做的是同一件事。把定價壓到讓開發者沒什麼理由不試試，等生產環境依賴 DeepSeek API，轉換成本就出現了。值得留意的是 V4-Pro 同時支援 Anthropic API 介面格式，已經用 Claude SDK 的工程師，遷移門檻更低。

對手承受的壓力

目前的價格差距：

模型	輸出 Token（每百萬）
DeepSeek V4-Pro	$0.87
Gemini 3.5 Flash	$9.00
GPT-5.5	~$30.00
Claude Opus 4.7	~$30.00

這個落差讓競爭對手幾乎不可能用每 Token 費用的框架說服開發者選自己，除非有其他因素加持，像是資料隱私、合規要求，或美國政府採購規定。

Anthropic 曾公開指控 DeepSeek 對 Claude 進行蒸餾攻擊，用 Claude 的輸出來訓練自己的模型，但這項指控沒有影響到 DeepSeek 的商業動作。美國政府在 3 月將 Anthropic 列為「供應鏈風險」後，川普政府要求聯邦機構停用 Claude 系列。DeepSeek 的降價攻勢放在這個地緣政治背景下讀，意涵又多了一層。

對開發者來說，免費試用的門檻已經低到沒理由不測。下一個值得看的數字會是 Q3 各大 AI 實驗室公布的 API 收入結構，那會說明這場價格戰打下去的真正破壞力。

如果這篇對你有幫助，訂閱電子報可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。

延伸閱讀

DeepSeek V4-Pro API 永久降價 75%，每百萬輸出 Token 只需 $0.87，比 GPT-5.5 便宜 34 倍

降幅的實際量級

成本能壓低的兩個結構性因素

開發者黏性才是真正目的

對手承受的壓力

相關文章

Fable 5 封禁第七天：White House 要「零越獄」，資安專家說技術上做不到

美國政府強制停用 Anthropic Fable 5 與 Mythos 5：一個「窄漏洞」引發的全球下線

降幅的實際量級

成本能壓低的兩個結構性因素

開發者黏性才是真正目的

對手承受的壓力

相關文章

Fable 5 封禁第七天：White House 要「零越獄」，資安專家說技術上做不到

美國政府強制停用 Anthropic Fable 5 與 Mythos 5：一個「窄漏洞」引發的全球下線

訂閱最新分享