Anthropic「Code with Claude 2026」開發者大會全解析：算力突破、智能體革命與開發者的新時代

2026 年 5 月 6 日，Anthropic 在舊金山開幕「Code with Claude 2026」，倫敦（5/19）、東京（6/10）陸續跟進。這次沒有發布新模型，卻也不是什麼縮水版大會——算力、智能體、編程工具、成本這幾條線同時動，針對的是同一個問題：Claude 在論文上跑得很快，但開發者用起來還是卡。

一、SpaceX 算力合作

Anthropic 一直受限於算力供給。這次宣布跟 SpaceX 達成合作，取得 Colossus 1 數據中心的長期使用權——超過 22 萬塊 NVIDIA GPU（H100、H200、GB200），全部可用。

促成合作的原因沒有太多官方說法，只知道雙方高層有過閉門交流，Anthropic 堅持安全優先這件事讓對方留下了印象。

開發者端的直接變化：

Claude Code 每五小時的速率限制翻倍
Pro 和 Max 帳戶高峰時段不再限流
Opus 的 API 上限大幅調高

二、Opus 4.7 和任務時域

大會沒有發新模型，但有一個新的評估框架值得注意。

生產環境測試

編程智能體全面切換到 Opus 4.7 Smart 模式後，處理生產工程任務的完成量是前一代的三倍。Claude Code 開發者目前每週平均使用 20 小時，API 調用量年增近 70 倍。這兩個數字說明 Claude 已經進入日常工作流程，不只是偶爾試用。

任務時域（Task Time Horizon）

Anthropic 提出用這個指標衡量 AI 能獨立跑多長、多複雜的任務。過去 Claude 頂多跑幾分鐘的簡單任務，現在可以穩定支撐數小時的連續執行。這不是一個行銷說法——它改變了你設計工作流程的方式。

三、Managed Agents 三項更新

這部分是整場大會影響最深的內容，三個功能都在解決不同的實際痛點。

多智能體編排（公開測試版）

主控智能體可以把任務拆分給多個子智能體，每個子智能體有自己的模型、提示詞和工具，上下文互相隔離。Netflix 用這個功能同時處理數百個 build 的 log，物流、製造、金融這類需要多步驟協同的場景都適用。

結果判定（公開測試版）

以前讓 AI 做任務，最難定義的就是「什麼叫做成功」。現在你只需要寫一份 Markdown 規格，系統會建立獨立的評分智能體來驗證結果，沒達標就在設定的最大次數內自動重試，不需要人工介入。醫療文件審查公司 Wisedocs 用這個把審查時間縮短了 50%。

追夢（Dreaming，研究預覽版）

會話結束後，智能體會自動回顧執行記錄，把有用的模式、經驗和錯誤寫入記憶庫，下次調用。法律 AI 公司 Harvey 導入後任務完成率約提升 6 倍；展示中一個智能體第二次跑同樣任務時，成功率從 4/6 變成 6/6。

四、Claude Code 的幾個新東西

Routines（排程任務）

設定一次，之後用 CRON、GitHub Webhook 或 API 觸發，Claude 自動執行，不需要有人在旁邊盯著。深夜監聽問題、修 bug、開 PR，都可以這樣跑。

Automode（自動執行）

內建雙重安全分類器。操作如果判定為無破壞性且沒有提示詞注入風險，就直接放行，不用每個步驟都手動確認。這解決了複雜任務流程裡一直被打斷的問題。

Worktrees（隔離工作樹）

Git Worktree 的設定和切換簡化很多。可以快速建立隔離環境讓多個功能並行開發，任務完成後自動清理。

Auto-memory（跨會話記憶）

Claude 會把專案背景、build 指令、團隊偏好寫進 memory.md，下次開新會話不用重新交代。這讓 Claude 從「每次都要重新認識的助手」變成真的了解你的專案的那種。

Claude Review（多智能體 Code Review）

安全性、可讀性、效能優化各有專屬智能體負責，最後由驗證智能體整合結果。Mercado Libre 旗下 2.3 萬名工程師在用，已審查超過 50 萬個 PR，目標是 2026 年 Q3 達到 90% 自主編碼。

五、GitHub 合作與成本

GitHub Copilot 產品負責人在現場分享了大規模 API 使用的工程心得。

提示詞緩存： 系統提示詞和工具前綴要保持完全靜態，才能維持 94–96% 的緩存命中率。在大量調用的情況下，這個數字直接決定成本能不能控住。

Advisor 策略： 日常執行走低成本模型（如 Haiku），遇到複雜問題才自動升級到 Opus 決策。這個架構在維持輸出品質的前提下，把推理成本降低了五倍。

六、Dario 和 Daniela 的對談

大會最後是兩位創辦人的圓桌對話，有幾個值得記下來的點。

增速數字： 2026 年 Q1 折算年化增速 80 倍。這個數字本身說明了為什麼要緊急跟 SpaceX 談算力——現有的供給根本跟不上。

阿姆達爾定律的警告： Dario 說，當編碼速度大幅提升後，Code Review 和變更驗證會變成新的瓶頸。也就是說，接下來要自動化的不是寫程式，而是審查程式。

MESOS 模型的事： 公司內部有一個能力遠超現有產品的模型，但因為安全評估還沒完成，所以不會發布。就這樣。

一人獨角獸： Dario 認為 2026 年底前，全球會出現第一家由單人運營、估值達十億美元的公司——從公司設立到設計、研發、維護、客服，整條線都靠 AI 跑。

小結

這場大會要說的事情其實很直接：模型夠強了，現在要解決的是怎麼讓它穩定跑在生產環境裡。算力合作解決了供給問題，智能體三項更新讓 AI 有了真正的系統工程能力，Claude Code 的新功能把「需要人值班」的部分一一補掉，成本優化讓企業端的帳真的算得過來。

延伸閱讀：

Anthropic「Code with Claude 2026」開發者大會全解析：算力突破、智能體革命與開發者的新時代

一、SpaceX 算力合作

二、Opus 4.7 和任務時域

生產環境測試

任務時域（Task Time Horizon）

三、Managed Agents 三項更新

多智能體編排（公開測試版）

結果判定（公開測試版）

追夢（Dreaming，研究預覽版）

四、Claude Code 的幾個新東西

Routines（排程任務）

Automode（自動執行）

Worktrees（隔離工作樹）

Auto-memory（跨會話記憶）

Claude Review（多智能體 Code Review）

五、GitHub 合作與成本

六、Dario 和 Daniela 的對談

小結

相關文章

Project Glasswing 首月成果：Claude Mythos 自主發現一萬個高危漏洞

Claude Mythos 自主找出 27 年前的系統漏洞：Anthropic Project Glasswing 正式啟動

一、SpaceX 算力合作

二、Opus 4.7 和任務時域

生產環境測試

任務時域（Task Time Horizon）

三、Managed Agents 三項更新

多智能體編排（公開測試版）

結果判定（公開測試版）

追夢（Dreaming，研究預覽版）

四、Claude Code 的幾個新東西

Routines（排程任務）

Automode（自動執行）

Worktrees（隔離工作樹）

Auto-memory（跨會話記憶）

Claude Review（多智能體 Code Review）

五、GitHub 合作與成本

六、Dario 和 Daniela 的對談

小結

相關文章

Project Glasswing 首月成果：Claude Mythos 自主發現一萬個高危漏洞

Claude Mythos 自主找出 27 年前的系統漏洞：Anthropic Project Glasswing 正式啟動

訂閱最新分享