Project Fetch Phase 2:Claude Opus 4.7 寫機器狗程式快了 37 倍,球還是沒撿到
重點摘要
Anthropic 的 Project Fetch Phase 2 顯示,Claude Opus 4.7 自主撰寫四足機器人控制程式碼的速度比無 AI 輔助的人類快了 37.7 倍,程式碼量也僅需人類的十分之一。機器狗最終沒有撿到球。這個結果既是里程碑,也是邊界的精準標示。
Anthropic 在 6 月 18 日發布了 Project Fetch 第二階段的研究結果: Claude Opus 4.7 在沒有額外工具支援的情況下,自主完成了一台四足機器人的感測器連接、控制程式撰寫和球體偵測任務,完成時間是去年最快人類團隊的二十七分之一。同一次測試裡,機器狗沒有撿到球。這兩個結果放在一起,才是這篇研究值得認真讀的地方。
這個實驗在測什麼
Anthropic 在 2025 年先做了 Phase 1:以相同任務測試人類在有 AI 輔助和沒有 AI 輔助下的表現。Phase 2 的設計是把人類換掉,讓 Opus 4.7 自己來,搭配 Claude Code 執行,研究員只需在一開始輸入任務描述,並在關鍵節點批准操作指令。
具體任務包含:連接機器狗的攝影機和光達感測器、撰寫運動控制程式、偵測地板上的海灘球、讓機器狗移向球並嘗試取回。
結果數字如下。Opus 4.7 完成三組試驗中的全部感測器與程式任務,每組用時約 9 分 35 秒。去年無 AI 輔助的人類需要大約 361 分鐘才能完成同樣的事,有 Claude 輔助的人類需要 181 分鐘。分別快了 37.7 倍和 18.9 倍。程式碼行數方面,Opus 4.7 寫了 1,045 行,有 Claude 的人類寫了 10,309 行。
球的取回任務失敗了。模型成功讓機器狗找到球的位置,也驅動機器狗靠近,但最後無法完成精確夾取。
數字背後的真相
37 倍的速度提升是真實的,但要把它放在正確的框架裡才有意義。
Anthropic 自己量、自己發布,在獨立第三方複製實驗之前,這組數字的精確值先當參考,不當定論。科學上,任何研究發布都是這樣的標準流程。
一個更根本的問題是:這 37 倍的加速在整個機器人開發週期裡佔多少份量。軟體撰寫大概是機器人開發時間的 20% 到 30%,剩下的在硬體整合、感測器校準、現場測試、安全驗證。就算程式碼撰寫快了 37 倍,整體開發週期壓縮的幅度可能在 4 到 6 倍之間。
1,045 行對上 10,309 行的差距也需要解釋。LLM 傾向找最短路徑的解法,人類則常在嘗試多種方向之後才收斂到可行解,過程中留下大量探索性程式碼。Opus 4.7 的程式碼更少,不一定品質更高,更可能是因為它從一開始就走了更直接的路。
沒撿到球,才是最精準的技術邊界標記。感測器整合、控制程式生成,這些任務有清晰的 API 文件和可參考的範例程式碼,語言模型擅長做這類模式比對和生成。閉迴路即時控制,包含電機反饋、物理接觸判斷、夾取姿態調整,需要以毫秒為單位的感測資料回饋,語言模型在這個層次目前缺乏原生能力。Anthropic 自己在研究報告中說,這是「物理自主 AI 的早期時代」,重點在「早期」兩個字。
接下來值得觀察的指標
Anthropic 在 6 月 30 日預告了一個以科學為主題的發布活動。結合 4 月以 4 億美元收購生技新創 Coefficient Bio、5 月招募 Andrej Karpathy 進入預訓練團隊,以及 諾貝爾得主 John Jumper 即將加入,Anthropic 在積累一套橫跨機器人與生物科學的研究基礎設施。Project Fetch Phase 2 在這個節點發布,很可能是 6 月 30 日活動的前置說明。
對 Phase 3 而言,真正的測試指標是:機器狗成功取回球的比率,以及完成一個從感測到動作的完整自主週期所需的時間。程式碼生成已經驗證,閉迴路控制才是下一個難關。
在工業應用端,這個速度提升若能推廣到 PLC 程式設計和機械手臂控制腳本,會讓工廠現場的軟體整合成本大幅下降。這個應用場景不需要解決夾取失敗的問題,只需要程式碼撰寫快,而 Project Fetch Phase 2 在這個指標上交出了有說服力的數字。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
延伸閱讀:
- AlphaFold 諾貝爾獎得主 John Jumper 離開 Google DeepMind,加入 Anthropic
- Claude Fable 5 與 Mythos 5 正式發布:效能、定價與邊界
外部來源:
相關文章
AlphaFold 諾貝爾獎得主 John Jumper 離開 Google DeepMind,加入 Anthropic
AlphaFold 共同開發者、2024 年諾貝爾化學獎得主 John Jumper 宣布離開 Google DeepMind,加入 Anthropic。在 AI 人才爭奪戰激烈化的當下,這是繼 Noam Shazeer 後又一名頂尖研究員出走 Google,轉投競爭對手懷抱。
美國政府下令關閉 Claude Fable 5:一個 Jailbreak 示範如何讓最強 AI 模型在三天後被迫下架
Claude Fable 5 上線三天後,美國商務部以國安理由發出出口管制令,Anthropic 被迫對全球用戶關閉服務。觸發點是一個 Unicode 同形字 Jailbreak 示範,洩露的系統提示長達 12 萬字元。