← Zurück zu Einblicke

Token Maxi: Wir müssen uns zwingen, mehr Tokens zu verbrauchen

Nils Liu
GenAI in Practice AI Agents Automation LLM

Kurzfassung

Google I/O 2026 zeigt: KI-Nutzung wächst nicht durch mehr manuelle Eingaben. 3,2 Billiarden Tokens pro Monat, 7-faches Jahreswachstum — dahinter stecken automatisierte Pipelines. Die Frage ist nicht ob, sondern wie automatisch die KI für dich arbeitet.

Token Maxi: Wir müssen uns zwingen, mehr Tokens zu verbrauchen

Google I/O 2026,Sundar Pichai 在台上秀了這張圖。

May 2024,每月 9.7 兆 token。May 2025,4800 億。May 2026,3.2 千兆(quadrillion)。兩年,七倍年增長,曲線幾乎垂直。

第一眼的反應只有一個念頭:這不可能是人打出來的。

全球幾億人同時瘋狂使用 ChatGPT、Gemini、Claude,打字速度加起來也追不上這條線。增長背後是自動化——機器在對機器說話,pipeline 在餵 pipeline,每一個「建好就讓它跑」的 AI agent 每分鐘都在消耗 token,從不休假。

這張圖不是使用量統計。是一份競爭宣言。


Token 是新的算力

2010 年代,雲端服務商的報表上「算力」就代表競爭力。有多少 GPU 時數、多少 TPU,決定你能做什麼。今天這個邏輯沒有消失,只是換了單位:token。

Token 是思考的原材料。你輸入多少 token 給模型,模型就有多少上下文可以推理;它輸出多少 token,就代表它做了多少工作。Token 的消耗量,等於 AI 應用到你問題上的總智識量。

一個人工審核一份合約要花兩小時,AI 審核同一份文件可能用掉 50,000 token,花 30 秒。如果你一年要審 10,000 份合約,手動是 20,000 小時,自動化是 5 億 token,大概等於幾百美元的 API 費用。

問題從來不是「AI 夠不夠好」,而是「你有沒有讓它跑起來」。


手動使用 AI 是個天花板

大多數人用 AI 的方式是這樣的:打開 ChatGPT,問一個問題,讀答案,關掉視窗。這是手動使用。手動使用 AI 有個硬限制:人的時間。

你一天工作八小時,不可能把八小時都花在跟 AI 對話上。即使你做到了,你消耗的 token 量相比 Google 每分鐘 190 億的速度,連零頭都不算。

但自動化 pipeline 沒有這個限制。

一條跑了三個月的 agent,累積的 token 消耗可以超過一個人類員工一整年手動使用 AI 的量。這不是誇張,這是數學。

所以「Token Maxi」的核心主張很簡單:你要贏,不是靠你自己用更多 AI,而是靠建更多系統讓 AI 自動替你用。


三個自動化層級

token 自動化大致可以分成三層,每一層的複雜度和回報都不同。

最基礎的是提示流水線。把重複的提示包成程式,定時觸發,輸出存到資料庫或發送通知。每天早上自動摘要昨天的新聞、有新客戶就自動生成歡迎信、月報出爐就自動解讀數字——任何一個會寫 Python 的人下午就能做出來,回報立竿見影。

往上一層是有工具的 agent。給模型搜尋、資料庫查詢、API 呼叫、程式碼執行的能力,讓它不只回答問題,還能採取行動。這一層開始有真正的自主性:你給它一個目標,它自己決定怎麼達到。挑戰在可靠性——agent 會犯錯,工具呼叫會失敗,上下文會超長。設計好的 harness、錯誤處理、重試邏輯,才是這一層的工程核心。

再上去是多 agent 編排。幾個 agent 各自處理子任務,研究、寫作、審核、格式化分工,最後匯聚成輸出。Google 那條曲線的大部分增長,很可能就來自這裡——企業級部署不是一個聊天框,是幾十條同時跑的 pipeline。


Token ROI 怎麼算

有人看到 token 費用就想省。這是錯的出發點。

正確的問題是:這些 token 換來了什麼?

用 100,000 token 審完一份貸款文件,如果這份文件原本要花律師三個小時,token 的 ROI 可能是幾百倍。用 10,000 token 生成一份行銷文案帶來一個新客戶,ROI 也很高。用 5,000 token 問 AI「今天天氣怎麼樣」,ROI 是零。

Token 消耗本身不是目標,是手段。目標是把高重複度、高認知負擔的工作交給機器,讓人類去做機器做不了的:判斷、關係、創意、道德決策。


複利效應

早跑自動化的人多了一樣東西:歷史資料。

每次 agent 運行都留下紀錄——輸入、輸出、哪裡出錯、哪裡成功。三個月後你的 pipeline 會比剛建好時精準很多;一年後它對你業務的熟悉度,是新進者一時追不上的。Google 從 9.7 兆跑到 3.2 千兆只花了兩年,而它的系統每天都在從這些消耗裡校正自己。這個校正速度,才是護城河。


每週重複三次以上的認知工作,只要有固定的輸入輸出格式,就應該是自動化的。不需要等更好的模型,也不需要等更便宜的 API。今天的條件已經夠了,差的只是讓它跑起來的決定。

3.2 千兆 token,靠的不是更多人手動打字,是更多系統自動運行。競爭差距就這樣一天一天拉開。

Abonnieren Sie die neuesten Erkenntnisse

Abonnieren Sie den Newsletter, um meine neuesten Artikel über AI Agents in Finanzinstituten, GenAI und Architektur zu erhalten.

Kein Spam. Jederzeit kündbar.