← Back to Insights

Token Maxi: We Must Force Ourselves to Consume More Tokens

Nils Liu
GenAI in Practice AI Agents Automation LLM

TL;DR

Google I/O 2026's chart reveals one truth: AI usage isn't growing because people type more. 3.2 quadrillion tokens/month, 7x Y/Y growth — behind that number are automated pipelines running without pause. The question isn't whether you use AI, but whether AI is automatically working for you.

Token Maxi: We Must Force Ourselves to Consume More Tokens

Google I/O 2026,Sundar Pichai 在台上秀了這張圖。

May 2024,每月 9.7 兆 token。May 2025,4800 億。May 2026,3.2 千兆(quadrillion)。兩年,七倍年增長,曲線幾乎垂直。

第一眼的反應只有一個念頭:這不可能是人打出來的。

全球幾億人同時瘋狂使用 ChatGPT、Gemini、Claude,打字速度加起來也追不上這條線。增長背後是自動化——機器在對機器說話,pipeline 在餵 pipeline,每一個「建好就讓它跑」的 AI agent 每分鐘都在消耗 token,從不休假。

這張圖不是使用量統計。是一份競爭宣言。


Token 是新的算力

2010 年代,雲端服務商的報表上「算力」就代表競爭力。有多少 GPU 時數、多少 TPU,決定你能做什麼。今天這個邏輯沒有消失,只是換了單位:token。

Token 是思考的原材料。你輸入多少 token 給模型,模型就有多少上下文可以推理;它輸出多少 token,就代表它做了多少工作。Token 的消耗量,等於 AI 應用到你問題上的總智識量。

一個人工審核一份合約要花兩小時,AI 審核同一份文件可能用掉 50,000 token,花 30 秒。如果你一年要審 10,000 份合約,手動是 20,000 小時,自動化是 5 億 token,大概等於幾百美元的 API 費用。

問題從來不是「AI 夠不夠好」,而是「你有沒有讓它跑起來」。


手動使用 AI 是個天花板

大多數人用 AI 的方式是這樣的:打開 ChatGPT,問一個問題,讀答案,關掉視窗。這是手動使用。手動使用 AI 有個硬限制:人的時間。

你一天工作八小時,不可能把八小時都花在跟 AI 對話上。即使你做到了,你消耗的 token 量相比 Google 每分鐘 190 億的速度,連零頭都不算。

但自動化 pipeline 沒有這個限制。

一條跑了三個月的 agent,累積的 token 消耗可以超過一個人類員工一整年手動使用 AI 的量。這不是誇張,這是數學。

所以「Token Maxi」的核心主張很簡單:你要贏,不是靠你自己用更多 AI,而是靠建更多系統讓 AI 自動替你用。


三個自動化層級

token 自動化大致可以分成三層,每一層的複雜度和回報都不同。

最基礎的是提示流水線。把重複的提示包成程式,定時觸發,輸出存到資料庫或發送通知。每天早上自動摘要昨天的新聞、有新客戶就自動生成歡迎信、月報出爐就自動解讀數字——任何一個會寫 Python 的人下午就能做出來,回報立竿見影。

往上一層是有工具的 agent。給模型搜尋、資料庫查詢、API 呼叫、程式碼執行的能力,讓它不只回答問題,還能採取行動。這一層開始有真正的自主性:你給它一個目標,它自己決定怎麼達到。挑戰在可靠性——agent 會犯錯,工具呼叫會失敗,上下文會超長。設計好的 harness、錯誤處理、重試邏輯,才是這一層的工程核心。

再上去是多 agent 編排。幾個 agent 各自處理子任務,研究、寫作、審核、格式化分工,最後匯聚成輸出。Google 那條曲線的大部分增長,很可能就來自這裡——企業級部署不是一個聊天框,是幾十條同時跑的 pipeline。


Token ROI 怎麼算

有人看到 token 費用就想省。這是錯的出發點。

正確的問題是:這些 token 換來了什麼?

用 100,000 token 審完一份貸款文件,如果這份文件原本要花律師三個小時,token 的 ROI 可能是幾百倍。用 10,000 token 生成一份行銷文案帶來一個新客戶,ROI 也很高。用 5,000 token 問 AI「今天天氣怎麼樣」,ROI 是零。

Token 消耗本身不是目標,是手段。目標是把高重複度、高認知負擔的工作交給機器,讓人類去做機器做不了的:判斷、關係、創意、道德決策。


複利效應

早跑自動化的人多了一樣東西:歷史資料。

每次 agent 運行都留下紀錄——輸入、輸出、哪裡出錯、哪裡成功。三個月後你的 pipeline 會比剛建好時精準很多;一年後它對你業務的熟悉度,是新進者一時追不上的。Google 從 9.7 兆跑到 3.2 千兆只花了兩年,而它的系統每天都在從這些消耗裡校正自己。這個校正速度,才是護城河。


每週重複三次以上的認知工作,只要有固定的輸入輸出格式,就應該是自動化的。不需要等更好的模型,也不需要等更便宜的 API。今天的條件已經夠了,差的只是讓它跑起來的決定。

3.2 千兆 token,靠的不是更多人手動打字,是更多系統自動運行。競爭差距就這樣一天一天拉開。

Get the latest insights

Join the newsletter to receive my latest articles on GenAI, AI Agents, and architecture.

No spam. Unsubscribe anytime.