Anthropic「Code with Claude 2026」開發者大會全解析:算力突破、智能體革命與開發者的新時代
2026 年 5 月 6 日,Anthropic 在舊金山開幕「Code with Claude 2026」,倫敦(5/19)、東京(6/10)陸續跟進。這次沒有發布新模型,卻也不是什麼縮水版大會——算力、智能體、編程工具、成本這幾條線同時動,針對的是同一個問題:Claude 在論文上跑得很快,但開發者用起來還是卡。
一、SpaceX 算力合作
Anthropic 一直受限於算力供給。這次宣布跟 SpaceX 達成合作,取得 Colossus 1 數據中心的長期使用權——超過 22 萬塊 NVIDIA GPU(H100、H200、GB200),全部可用。
促成合作的原因沒有太多官方說法,只知道雙方高層有過閉門交流,Anthropic 堅持安全優先這件事讓對方留下了印象。
開發者端的直接變化:
- Claude Code 每五小時的速率限制翻倍
- Pro 和 Max 帳戶高峰時段不再限流
- Opus 的 API 上限大幅調高
二、Opus 4.7 和任務時域
大會沒有發新模型,但有一個新的評估框架值得注意。
生產環境測試
編程智能體全面切換到 Opus 4.7 Smart 模式後,處理生產工程任務的完成量是前一代的三倍。Claude Code 開發者目前每週平均使用 20 小時,API 調用量年增近 70 倍。這兩個數字說明 Claude 已經進入日常工作流程,不只是偶爾試用。
任務時域(Task Time Horizon)
Anthropic 提出用這個指標衡量 AI 能獨立跑多長、多複雜的任務。過去 Claude 頂多跑幾分鐘的簡單任務,現在可以穩定支撐數小時的連續執行。這不是一個行銷說法——它改變了你設計工作流程的方式。
三、Managed Agents 三項更新
這部分是整場大會影響最深的內容,三個功能都在解決不同的實際痛點。
多智能體編排(公開測試版)
主控智能體可以把任務拆分給多個子智能體,每個子智能體有自己的模型、提示詞和工具,上下文互相隔離。Netflix 用這個功能同時處理數百個 build 的 log,物流、製造、金融這類需要多步驟協同的場景都適用。
結果判定(公開測試版)
以前讓 AI 做任務,最難定義的就是「什麼叫做成功」。現在你只需要寫一份 Markdown 規格,系統會建立獨立的評分智能體來驗證結果,沒達標就在設定的最大次數內自動重試,不需要人工介入。醫療文件審查公司 Wisedocs 用這個把審查時間縮短了 50%。
追夢(Dreaming,研究預覽版)
會話結束後,智能體會自動回顧執行記錄,把有用的模式、經驗和錯誤寫入記憶庫,下次調用。法律 AI 公司 Harvey 導入後任務完成率約提升 6 倍;展示中一個智能體第二次跑同樣任務時,成功率從 4/6 變成 6/6。
四、Claude Code 的幾個新東西
Routines(排程任務)
設定一次,之後用 CRON、GitHub Webhook 或 API 觸發,Claude 自動執行,不需要有人在旁邊盯著。深夜監聽問題、修 bug、開 PR,都可以這樣跑。
Automode(自動執行)
內建雙重安全分類器。操作如果判定為無破壞性且沒有提示詞注入風險,就直接放行,不用每個步驟都手動確認。這解決了複雜任務流程裡一直被打斷的問題。
Worktrees(隔離工作樹)
Git Worktree 的設定和切換簡化很多。可以快速建立隔離環境讓多個功能並行開發,任務完成後自動清理。
Auto-memory(跨會話記憶)
Claude 會把專案背景、build 指令、團隊偏好寫進 memory.md,下次開新會話不用重新交代。這讓 Claude 從「每次都要重新認識的助手」變成真的了解你的專案的那種。
Claude Review(多智能體 Code Review)
安全性、可讀性、效能優化各有專屬智能體負責,最後由驗證智能體整合結果。Mercado Libre 旗下 2.3 萬名工程師在用,已審查超過 50 萬個 PR,目標是 2026 年 Q3 達到 90% 自主編碼。
五、GitHub 合作與成本
GitHub Copilot 產品負責人在現場分享了大規模 API 使用的工程心得。
提示詞緩存: 系統提示詞和工具前綴要保持完全靜態,才能維持 94–96% 的緩存命中率。在大量調用的情況下,這個數字直接決定成本能不能控住。
Advisor 策略: 日常執行走低成本模型(如 Haiku),遇到複雜問題才自動升級到 Opus 決策。這個架構在維持輸出品質的前提下,把推理成本降低了五倍。
六、Dario 和 Daniela 的對談
大會最後是兩位創辦人的圓桌對話,有幾個值得記下來的點。
增速數字: 2026 年 Q1 折算年化增速 80 倍。這個數字本身說明了為什麼要緊急跟 SpaceX 談算力——現有的供給根本跟不上。
阿姆達爾定律的警告: Dario 說,當編碼速度大幅提升後,Code Review 和變更驗證會變成新的瓶頸。也就是說,接下來要自動化的不是寫程式,而是審查程式。
MESOS 模型的事: 公司內部有一個能力遠超現有產品的模型,但因為安全評估還沒完成,所以不會發布。就這樣。
一人獨角獸: Dario 認為 2026 年底前,全球會出現第一家由單人運營、估值達十億美元的公司——從公司設立到設計、研發、維護、客服,整條線都靠 AI 跑。
小結
這場大會要說的事情其實很直接:模型夠強了,現在要解決的是怎麼讓它穩定跑在生產環境裡。算力合作解決了供給問題,智能體三項更新讓 AI 有了真正的系統工程能力,Claude Code 的新功能把「需要人值班」的部分一一補掉,成本優化讓企業端的帳真的算得過來。
延伸閱讀:
Claude Code 洩漏事件解析:一窺 Anthropic 的 AI Agent 核心藍圖
2026年3月底,Anthropic 在 npm 發布更新時意外夾帶 59.8MB 的 Source Map,導致 Claude Code 的底層程式碼全面洩漏。這不僅是一次工程失誤,更是企業級 Agent 架構、多層提示詞與臥底模式等設計細節的首次大解密。
AI 購物代理全面開戰:Walmart、Target、Shopify 如何重新定義電商
AI 購物代理正從展示品變成真正的消費工具。Walmart 推出自研 AI 助手 Sparky,Target 與 Google Gemini 合作,Shopify 發布 Agentic Commerce 協議。當 AI Agent 開始替你刷卡,電商的遊戲規則正在被徹底改寫。
Claude Code 洩漏事件解析:一窺 Anthropic 的 AI Agent 核心藍圖
2026年3月底,Anthropic 在 npm 發布更新時意外夾帶 59.8MB 的 Source Map,導致 Claude Code 的底層程式碼全面洩漏。這不僅是一次工程失誤,更是企業級 Agent 架構、多層提示詞與臥底模式等設計細節的首次大解密。
AI 購物代理全面開戰:Walmart、Target、Shopify 如何重新定義電商
AI 購物代理正從展示品變成真正的消費工具。Walmart 推出自研 AI 助手 Sparky,Target 與 Google Gemini 合作,Shopify 發布 Agentic Commerce 協議。當 AI Agent 開始替你刷卡,電商的遊戲規則正在被徹底改寫。