← 返回文章列表

Anthropic「Code with Claude 2026」開發者大會全解析:算力突破、智能體革命與開發者的新時代

Nils Liu
GenAI 新聞觀察 Anthropic Claude Developer AI Agent
Anthropic「Code with Claude 2026」開發者大會全解析:算力突破、智能體革命與開發者的新時代

2026 年 5 月 6 日,Anthropic 在舊金山開幕「Code with Claude 2026」,倫敦(5/19)、東京(6/10)陸續跟進。這次沒有發布新模型,卻也不是什麼縮水版大會——算力、智能體、編程工具、成本這幾條線同時動,針對的是同一個問題:Claude 在論文上跑得很快,但開發者用起來還是卡。


一、SpaceX 算力合作

Anthropic 一直受限於算力供給。這次宣布跟 SpaceX 達成合作,取得 Colossus 1 數據中心的長期使用權——超過 22 萬塊 NVIDIA GPU(H100、H200、GB200),全部可用。

促成合作的原因沒有太多官方說法,只知道雙方高層有過閉門交流,Anthropic 堅持安全優先這件事讓對方留下了印象。

開發者端的直接變化:

  • Claude Code 每五小時的速率限制翻倍
  • Pro 和 Max 帳戶高峰時段不再限流
  • Opus 的 API 上限大幅調高

二、Opus 4.7 和任務時域

大會沒有發新模型,但有一個新的評估框架值得注意。

生產環境測試

編程智能體全面切換到 Opus 4.7 Smart 模式後,處理生產工程任務的完成量是前一代的三倍。Claude Code 開發者目前每週平均使用 20 小時,API 調用量年增近 70 倍。這兩個數字說明 Claude 已經進入日常工作流程,不只是偶爾試用。

任務時域(Task Time Horizon)

Anthropic 提出用這個指標衡量 AI 能獨立跑多長、多複雜的任務。過去 Claude 頂多跑幾分鐘的簡單任務,現在可以穩定支撐數小時的連續執行。這不是一個行銷說法——它改變了你設計工作流程的方式。


三、Managed Agents 三項更新

這部分是整場大會影響最深的內容,三個功能都在解決不同的實際痛點。

多智能體編排(公開測試版)

主控智能體可以把任務拆分給多個子智能體,每個子智能體有自己的模型、提示詞和工具,上下文互相隔離。Netflix 用這個功能同時處理數百個 build 的 log,物流、製造、金融這類需要多步驟協同的場景都適用。

結果判定(公開測試版)

以前讓 AI 做任務,最難定義的就是「什麼叫做成功」。現在你只需要寫一份 Markdown 規格,系統會建立獨立的評分智能體來驗證結果,沒達標就在設定的最大次數內自動重試,不需要人工介入。醫療文件審查公司 Wisedocs 用這個把審查時間縮短了 50%。

追夢(Dreaming,研究預覽版)

會話結束後,智能體會自動回顧執行記錄,把有用的模式、經驗和錯誤寫入記憶庫,下次調用。法律 AI 公司 Harvey 導入後任務完成率約提升 6 倍;展示中一個智能體第二次跑同樣任務時,成功率從 4/6 變成 6/6。


四、Claude Code 的幾個新東西

Routines(排程任務)

設定一次,之後用 CRON、GitHub Webhook 或 API 觸發,Claude 自動執行,不需要有人在旁邊盯著。深夜監聽問題、修 bug、開 PR,都可以這樣跑。

Automode(自動執行)

內建雙重安全分類器。操作如果判定為無破壞性且沒有提示詞注入風險,就直接放行,不用每個步驟都手動確認。這解決了複雜任務流程裡一直被打斷的問題。

Worktrees(隔離工作樹)

Git Worktree 的設定和切換簡化很多。可以快速建立隔離環境讓多個功能並行開發,任務完成後自動清理。

Auto-memory(跨會話記憶)

Claude 會把專案背景、build 指令、團隊偏好寫進 memory.md,下次開新會話不用重新交代。這讓 Claude 從「每次都要重新認識的助手」變成真的了解你的專案的那種。

Claude Review(多智能體 Code Review)

安全性、可讀性、效能優化各有專屬智能體負責,最後由驗證智能體整合結果。Mercado Libre 旗下 2.3 萬名工程師在用,已審查超過 50 萬個 PR,目標是 2026 年 Q3 達到 90% 自主編碼。


五、GitHub 合作與成本

GitHub Copilot 產品負責人在現場分享了大規模 API 使用的工程心得。

提示詞緩存: 系統提示詞和工具前綴要保持完全靜態,才能維持 94–96% 的緩存命中率。在大量調用的情況下,這個數字直接決定成本能不能控住。

Advisor 策略: 日常執行走低成本模型(如 Haiku),遇到複雜問題才自動升級到 Opus 決策。這個架構在維持輸出品質的前提下,把推理成本降低了五倍。


六、Dario 和 Daniela 的對談

大會最後是兩位創辦人的圓桌對話,有幾個值得記下來的點。

增速數字: 2026 年 Q1 折算年化增速 80 倍。這個數字本身說明了為什麼要緊急跟 SpaceX 談算力——現有的供給根本跟不上。

阿姆達爾定律的警告: Dario 說,當編碼速度大幅提升後,Code Review 和變更驗證會變成新的瓶頸。也就是說,接下來要自動化的不是寫程式,而是審查程式。

MESOS 模型的事: 公司內部有一個能力遠超現有產品的模型,但因為安全評估還沒完成,所以不會發布。就這樣。

一人獨角獸: Dario 認為 2026 年底前,全球會出現第一家由單人運營、估值達十億美元的公司——從公司設立到設計、研發、維護、客服,整條線都靠 AI 跑。


小結

這場大會要說的事情其實很直接:模型夠強了,現在要解決的是怎麼讓它穩定跑在生產環境裡。算力合作解決了供給問題,智能體三項更新讓 AI 有了真正的系統工程能力,Claude Code 的新功能把「需要人值班」的部分一一補掉,成本優化讓企業端的帳真的算得過來。

延伸閱讀:

訂閱最新分享

加入電子報,第一時間獲取關於金融 AI Agent 實戰與架構設計的最新文章。不訂閱你會慢別人一個週期!

絕不發送垃圾信。隨時皆可取消訂閱。