Claude Fable 5 今日正式收費:每百萬輸出代幣 50 美元,企業部署的三道限制
重點摘要
Fable 5 的免費試用今日結束,API 定價每百萬輸出 50 美元是 Opus 4.8 的兩倍。30 天強制資料保留政策、安全分類器的領域落差、以及 Mythos 5 的雙軌架構,是工程師在切換前需要理解的三個關鍵點。
Fable 5 的安全分類器整體觸發率低於 5%,但目前 Anthropic 沒有公布按應用場景細分的數字。醫療記錄分析、藥物反應研究、法律文件審查的實際觸發率,工程師社群還沒有系統性的回報。如果你在這些高敏感領域實測過,能分享你的觸發率嗎?這個數字對評估切換成本來說,遠比官方的 5% 平均值更關鍵。
六月二十三日,Claude Fable 5 的免費試用期結束。從今天起,Anthropic 向所有用戶按 usage credits 計費:每百萬輸入代幣 10 美元,每百萬輸出代幣 50 美元。這個價格是 Claude Opus 4.8 的兩倍,也和 GPT-5.5 的輸出定價相比高出整整一倍。
Fable 5 在六月九日正式發布,短暫被美國商務部出口管制叫停後,本週才重新上線。Anthropic 的官方公告把它定位為有史以來最強的公開發布模型,強調在軟體工程、科學研究和長程自主任務上的表現。TechCrunch 的報導則點出了一個矛盾:模型發布的幾天前,Anthropic 才剛公開表示 AI 正在變得太危險。
帳單怎麼算
定價換算成實際使用成本,有幾個數量級值得知道。
一次中等規模的 Claude Code 任務,輸出大約在 5,000 到 20,000 代幣之間。換算之後,每次任務花費 0.25 到 1 美元。如果你每天跑五十次複雜任務,一個月下來大概是 375 到 1,500 美元。對照 Claude Max 訂閱的 200 美元月費,有固定用量需求的開發者需要仔細比較。
Anthropic 目前提供的緩衝機制是「fallback credit」:當 Fable 5 的安全分類器拒絕一個請求,系統自動退回 Opus 4.8 處理,被拒絕的那次請求不收費,轉跑 Opus 4.8 的 prompt cache 重算成本也有補貼。從工程角度來說,這個設計相當體貼,但要用好它,API 端需要調整錯誤處理邏輯。拒絕請求的 API 回應是 stop_reason: "refusal",搭配 HTTP 200,不是 4xx 或 5xx 錯誤。如果沿用舊的 exception-based 錯誤處理,拒絕訊息會被當成成功回應處理,不會觸發任何 retry 邏輯。
數字背後的真相
Anthropic 報告 Fable 5 在 SWE-bench Pro 拿下 80.3%,GPT-5.5 是 58.6%。兩個數字都是各家自己量的,benchmark 條件不一定可比。21.7 分的差距如果成立,是很顯著的領先,但在第三方獨立複現出現前,這個數字要保留一定懷疑度。
Stripe 是目前最具說服力的第三方案例:他們使用 Fable 5 處理五千萬行程式碼的遷移工作,把本來要幾個月的工程壓縮到幾天。有名有姓的真實客戶,比任何 benchmark 數字更能說明模型的實際能力上限。
有兩個技術限制被新聞報導普遍忽略。
第一是 30 天強制資料保留。Fable 5 和 Mythos 5 都被 Anthropic 列入「Covered Models」清單,所有 API 呼叫的資料保留期間是 30 天,不支援 zero-retention 部署。金融服務、醫療健保、法律事務所有大量需要零資料留存的客戶資料場景。這條規定讓 Fable 5 在相當一部分企業用例上直接出局,和 GPT-5.5 的 zero-retention 選項相比處於劣勢。
第二是 adaptive thinking 強制開啟。Fable 5 的思考模式無法關閉,只能調整深度。這代表延遲下限比 Opus 4.8 高,對即時客服對話或需要快速回應的場景,這不是可調參數,是架構限制。
Fable 5 和 Mythos 5 的雙軌邏輯
Fable 5 和 Mythos 5 共用同一個底層模型。區別在於 Fable 5 加裝了安全分類器,Mythos 5 沒有。
安全分類器的覆蓋範圍包括網路安全、生物學、化學和模型提煉。觸碰到這些領域的請求,Fable 5 會拒絕並回退到 Opus 4.8 處理。整體觸發率低於 5%,聽起來很低,但這是跨所有使用場景的加總平均。一個聚焦在生物製藥研究的應用,觸發率可能遠高於這個數字。
Mythos 5 沒有這層過濾,但只向 Project Glasswing 的核准客戶開放,對象主要是政府合作夥伴和特定生物研究機構。這個設計實際上把一個模型拆成兩個市場:大眾市場用有護欄的 Fable 5,機密場景用去掉護欄的 Mythos 5。
這個雙軌策略有一個工程意涵:它讓 Anthropic 能在符合政府監管要求的同時,維持公開市場的模型競爭力。代價是 API 行為不一致,同樣的 prompt 在兩個模型上可能拿到完全不同的結果。
接下來值得觀察的指標
三個具體數字,未來六個月會說話。
一是企業 zero-retention 合規壓力。如果頭部金融和醫療客戶明確要求 Anthropic 提供 zero-retention 選項,而 Anthropic 沒有回應,就可以觀察到這些客戶向 GPT-5.5 或 Gemini 3.5 Pro 靠攏的跡象,這會體現在 API 呼叫量的市場份額變化上。
二是 OpenAI 的定價反應。Fable 5 輸出 $50/M 比 GPT-5.5 的 $25/M 貴一倍。如果接下來幾個月出現第三方驗證顯示性能差距沒有 Anthropic 聲稱的那麼大,OpenAI 大概率不需要降價,市場份額就會自動重新分配。
三是 Fable 5 拒絕率的公開數據。Anthropic 目前只公布整體 5% 的觸發率,分領域的數字缺失。一旦有研究機構或大型 API 聚合平台開始公布分場景數據,整個安全分類器的設計會接受更嚴格的公眾審視。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
相關閱讀
相關文章
Tokenmaxxing 終結:企業 AI 燒錢潮如何釀出 861% 程式碼翻修率
Uber 四個月燒完全年 AI 預算,Meta 關閉 token 消費排行榜,程式碼翻修率卻暴衝 861%。2026 年 tokenmaxxing 終結:多燒 token 只是多買錯誤,企業正在學費大學中清醒。
Claude Tag 上線:Anthropic 把 AI 永久駐留進你的 Slack 頻道
Anthropic 於 6 月 23 日推出 Claude Tag,讓 Claude Opus 4.8 以持久記憶的頻道隊友身份進駐 Slack。65% 代碼生成率是 Anthropic 自家數字,未有獨立驗證。Token 成本、遷移期限與企業資安邊界,才是工程師需要看清的三個核心問題。