Google I/O 2026 前夕:Gemini Omni 洩漏,AI 三強格局面臨重組
重點摘要
明天 Google I/O 開幕,洩漏的 Gemini Omni 整合文字、圖片、影片生成,但能否追上 Claude Mythos 的 93.9% SWE-bench 分數?
Google I/O 2026 明天開幕。主題演講定在太平洋時間 5 月 19 日上午 10 點,Mountain View 的 Shoreline Amphitheatre,現場同步直播。
但今天最值得聊的消息,已經比官方公告先出現了。
Gemini Omni 洩漏:一個 pipeline 搞定三件事
五月初,一個叫做 Gemini Omni 的模型悄悄在社群流傳。根據多個來源的報導,這是 Google 準備在 I/O 上發布的新模型,核心特色是把文字、圖片、影片生成整合進同一個 pipeline。
現在的 AI 模型通常是分開的,要生圖用一個,要生影片用另一個,要問問題又是另一個。Gemini Omni 如果如傳聞所示,開發者只需要一個 API、一個 context window,就能處理三種模態的輸入輸出。這對開發者來說是一個實際的生產力優化,不是噱頭。
比較合理的期待是:Omni 六月起會對 Gemini Advanced 訂閱者開放,年底前可能有更廣泛的免費層。
模型競賽的現實
說白了,現在 AI 模型的第一名是 Anthropic。Claude Mythos Preview 在 4 月 7 日公布,在 18 項測評中拿下 17 項第一。SWE-bench Verified 93.9%,Terminal-Bench 2.0 82.0%,USAMO 2026 數學測試 97.6%。這些數字讓 4 月 24 日才發布的 GPT-5.5 看起來像是第二名的選手。
Google 要推出的新 Gemini,目前外界的預期是「大約在 GPT-5.5 水準」。sources.news 5 月 14 日的報導直接說:「不會推動 frontier」。這不是 Google 輸了,這是現實的描述。
問題在於,Google 的策略從來都不只是「最強模型」,而是「整合在哪裡都用得到的 Android」。
Android 才是真正的戰場
5 月 12 日的 Android Show 已經放出了幾個信號。Gemini Intelligence 的設計是跨 app 工作,能在螢幕上理解內容並完成多步驟任務。Googlebook 是搭載 Gemini 的 Android 筆電,Acer、ASUS、Dell 預計今年秋天上市。Android XR 眼鏡也會在 I/O 上亮相,雖然只是預覽。
Apple 的 WWDC 預計六月,同樣會大推 AI 整合。Google 必須在六月前先建立存在感。這件事,比 Mythos 或 GPT-5.5 的分數更緊迫。
換個方式說:Google 真正在打的,是讓 Gemini 成為你下一支 Android 手機、下一台筆電的預設 AI 層,而不是讓工程師跑 benchmark。
明天會看到什麼
幾乎可以確定的:新 Gemini 模型官宣、Googlebook 細節、Android XR 眼鏡預覽。
可能出現的:Gemini Omni 完整展示、更多 Gemini for Chrome 整合細節、Android 17 正式時間表。
不太可能的:追上 Claude Mythos 等級的 benchmark 數字。
主題演講直播在 io.google。台灣時間是明天凌晨 1 點。
如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。
延伸閱讀
相關文章
Google I/O 2026 主題演講:Gemini Intelligence 內建進 Android,Googlebook 要取代 Chromebook
Google I/O 2026 主題演講發布 Gemini Intelligence 嵌入 Android 系統層、Googlebook 筆電新品類,以及三星合作 XR 眼鏡,模型排名雖落後 Claude Mythos,但 Google 押注的是分發規模。
Google Antigravity CLI 正式上線:Gemini CLI 今日停服
Google Antigravity CLI 6 月 18 日正式取代 Gemini CLI,免費用戶即時失去訪問。Apache 2.0 開源工具在一年多後走入歷史,AI 編程工具市場全面進入閉源時代。