← 返回文章列表

Google I/O 2026 前夕:Gemini Omni 洩漏,AI 三強格局面臨重組

Nils Liu
GenAI 新聞觀察 Google Gemini AI Model

重點摘要

明天 Google I/O 開幕,洩漏的 Gemini Omni 整合文字、圖片、影片生成,但能否追上 Claude Mythos 的 93.9% SWE-bench 分數?

Google I/O 2026 前夕:Gemini Omni 洩漏,AI 三強格局面臨重組

Google I/O 2026 明天開幕。主題演講定在太平洋時間 5 月 19 日上午 10 點,Mountain View 的 Shoreline Amphitheatre,現場同步直播。

但今天最值得聊的消息,已經比官方公告先出現了。

Gemini Omni 洩漏:一個 pipeline 搞定三件事

五月初,一個叫做 Gemini Omni 的模型悄悄在社群流傳。根據多個來源的報導,這是 Google 準備在 I/O 上發布的新模型,核心特色是把文字、圖片、影片生成整合進同一個 pipeline

現在的 AI 模型通常是分開的,要生圖用一個,要生影片用另一個,要問問題又是另一個。Gemini Omni 如果如傳聞所示,開發者只需要一個 API、一個 context window,就能處理三種模態的輸入輸出。這對開發者來說是一個實際的生產力優化,不是噱頭。

比較合理的期待是:Omni 六月起會對 Gemini Advanced 訂閱者開放,年底前可能有更廣泛的免費層。

模型競賽的現實

說白了,現在 AI 模型的第一名是 Anthropic。Claude Mythos Preview 在 4 月 7 日公布,在 18 項測評中拿下 17 項第一。SWE-bench Verified 93.9%,Terminal-Bench 2.0 82.0%,USAMO 2026 數學測試 97.6%。這些數字讓 4 月 24 日才發布的 GPT-5.5 看起來像是第二名的選手。

Google 要推出的新 Gemini,目前外界的預期是「大約在 GPT-5.5 水準」。sources.news 5 月 14 日的報導直接說:「不會推動 frontier」。這不是 Google 輸了,這是現實的描述。

問題在於,Google 的策略從來都不只是「最強模型」,而是「整合在哪裡都用得到的 Android」。

Android 才是真正的戰場

5 月 12 日的 Android Show 已經放出了幾個信號。Gemini Intelligence 的設計是跨 app 工作,能在螢幕上理解內容並完成多步驟任務。Googlebook 是搭載 Gemini 的 Android 筆電,Acer、ASUS、Dell 預計今年秋天上市。Android XR 眼鏡也會在 I/O 上亮相,雖然只是預覽。

Apple 的 WWDC 預計六月,同樣會大推 AI 整合。Google 必須在六月前先建立存在感。這件事,比 Mythos 或 GPT-5.5 的分數更緊迫。

換個方式說:Google 真正在打的,是讓 Gemini 成為你下一支 Android 手機、下一台筆電的預設 AI 層,而不是讓工程師跑 benchmark。

明天會看到什麼

幾乎可以確定的:新 Gemini 模型官宣、Googlebook 細節、Android XR 眼鏡預覽。

可能出現的:Gemini Omni 完整展示、更多 Gemini for Chrome 整合細節、Android 17 正式時間表。

不太可能的:追上 Claude Mythos 等級的 benchmark 數字。

主題演講直播在 io.google。台灣時間是明天凌晨 1 點。

如果這篇對你有幫助,訂閱電子報 可以第一時間收到 AI PM 實戰洞察與 GenAI 落地案例。


延伸閱讀

訂閱最新分享

加入電子報,第一時間獲取關於金融 AI Agent 實戰與架構設計的最新文章。不訂閱你會慢別人一個週期!

絕不發送垃圾信。隨時皆可取消訂閱。