← 返回文章列表

DeepSeek V4-Pro API 永久降價 75%,每百萬輸出 Token 只需 $0.87,比 GPT-5.5 便宜 34 倍

Nils Liu
DeepSeek API Pricing GenAI 新聞觀察

重點摘要

DeepSeek 宣布將 V4-Pro API 的 75% 折扣永久化,輸出 Token 每百萬僅 $0.87,比 GPT-5.5 便宜 34 倍。這不只是降價,是一場針對西方 AI 定價護城河的定點清除。

DeepSeek V4-Pro API 永久降價 75%,每百萬輸出 Token 只需 $0.87,比 GPT-5.5 便宜 34 倍

DeepSeek 5 月 22 日宣布,原定 5 月 31 日到期的 V4-Pro API 折扣不會過期了。75% 折扣從促銷變成常態定價,輸出 Token 每百萬 $0.87、輸入 $0.435、快取命中更只要 $0.003625。這個數字比 GPT-5.5 便宜 34 倍,已經不是促銷可以解釋的價差。

降幅的實際量級

舊定價是輸入 $1.74 每百萬、輸出 $3.48 每百萬。新定價把兩個數字各縮到四分之一,快取命中的折扣更大,部分場景跌到原價的十分之一。對於每天呼叫 API 幾千萬次的工程團隊,這直接是帳單金額少了七八成。

V4-Pro 的架構是混合專家(MoE),1.6 兆總參數,每次任務實際啟動約 490 億參數,支援 100 萬 Token 的上下文視窗。按效能指標,這個等級跟 GPT-5.5 和 Claude Opus 4.7 在同一個競技場。同等性能、四分之一價,這個落差不會隨著時間自然收斂。

成本能壓低的兩個結構性因素

關鍵在硬體選擇。V4-Pro 從一開始就針對華為昇騰 950PR 晶片優化,不依賴 Nvidia GPU。這讓 DeepSeek 的推論成本結構跟 OpenAI、Anthropic 截然不同,西方廠商仍在支付 H100/H200 的高價,DeepSeek 繞開了這條路。Counterpoint Research 分析師 Wei Sun 指出,昇騰 950 系列量產加速是 DeepSeek 能維持低價的結構性因素,今年預計相關系統出貨量是去年的 2.5 倍。

第二個因素是架構效率。MoE 設計讓模型在每次推論時只啟動參數總量的約 3%,大幅降低每個 Token 的算力消耗。硬體繞開了 Nvidia 的議價權,架構壓低了算力本身的需求,兩條路同時走,才壓得出 34 倍的價差。

開發者黏性才是真正目的

有 AI 基礎設施分析師把這個定價策略比作 2006 年的 AWS。當年 Amazon 用接近虧損的定價拿下雲端市場,等開發者系統全跑在 AWS 上再說別的。後來十年的雲端市場就是被這套策略定形的。

DeepSeek 現在做的是同一件事。把定價壓到讓開發者沒什麼理由不試試,等生產環境依賴 DeepSeek API,轉換成本就出現了。值得留意的是 V4-Pro 同時支援 Anthropic API 介面格式,已經用 Claude SDK 的工程師,遷移門檻更低。

對手承受的壓力

目前的價格差距:

模型輸出 Token(每百萬)
DeepSeek V4-Pro$0.87
Gemini 3.5 Flash$9.00
GPT-5.5~$30.00
Claude Opus 4.7~$30.00

這個落差讓競爭對手幾乎不可能用每 Token 費用的框架說服開發者選自己,除非有其他因素加持,像是資料隱私、合規要求,或美國政府採購規定。

Anthropic 曾公開指控 DeepSeek 對 Claude 進行蒸餾攻擊,用 Claude 的輸出來訓練自己的模型,但這項指控沒有影響到 DeepSeek 的商業動作。美國政府在 3 月將 Anthropic 列為「供應鏈風險」後,川普政府要求聯邦機構停用 Claude 系列。DeepSeek 的降價攻勢放在這個地緣政治背景下讀,意涵又多了一層。

對開發者來說,免費試用的門檻已經低到沒理由不測。下一個值得看的數字會是 Q3 各大 AI 實驗室公布的 API 收入結構,那會說明這場價格戰打下去的真正破壞力。

如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。


延伸閱讀

訂閱最新分享

加入電子報,第一時間獲取關於金融 AI Agent 實戰與架構設計的最新文章。不訂閱你會慢別人一個週期!

絕不發送垃圾信。隨時皆可取消訂閱。