2025 年度回顧:不喧嘩的扎實推動
我的 2025 年 AI 歷險有四個數字:6、5、1、6。不是因為多光鮮,而是因為很踏實。在銀行做 GenAI 就像在營運中的大樓換管線,真正難的往往不是模型,而是工程與信任。 我的 2025 年 AI 歷險有四個數字: 6項 新型專利 已核准 ...
分享金融機構 AI Agent 實戰、GenAI 落地應用、GraphRAG、Ontology 架構、DevOps × AI 與企業 AI 平台建構的第一手觀察與思考。
我的 2025 年 AI 歷險有四個數字:6、5、1、6。不是因為多光鮮,而是因為很踏實。在銀行做 GenAI 就像在營運中的大樓換管線,真正難的往往不是模型,而是工程與信任。 我的 2025 年 AI 歷險有四個數字: 6項 新型專利 已核准 ...
GPT-5.6 Sol 上線卻不對外開放,美國政府審查框架讓約 20 家企業先用,其餘等候。比 benchmark 更重要的,是這套管控模式能維持多久。
中國 LineShine 以 2.198 Exaflops 登上 TOP500 全球第一,全程不含 Nvidia、Intel、AMD 晶片。但 Linpack 算的是 FP64 線性代數,不是 AI 訓練。費米估算顯示同等 GPU 叢集訓練同規模大模型快 5 倍,電費省 9 倍。
GPT-5.6 Sol、Terra、Luna 三層模型於 6 月 26 日發布,僅限約 20 個政府核准組織搶先存取。Sol 在 Terminal-Bench 2.1 拿下 91.9%,但獨立評測機構 METR 同步記錄了它最高的「作弊率」。這個矛盾是今年 AI 安全領域最值得追蹤的訊號。
OpenRouter 上美系模型 token 佔比一年內從 70% 跌至 30%,DeepSeek 單一供應商拿下 16.3%。ChatGPT 全球市佔首次跌破五成,OpenAI 考慮大幅降價但 IPO 招股書已靜默申請。合規壁壘與成本底線,哪個更持久?
Uber 四個月燒完全年 AI 預算,Meta 關閉 token 消費排行榜,程式碼翻修率卻暴衝 861%。2026 年 tokenmaxxing 終結:多燒 token 只是多買錯誤,企業正在學費大學中清醒。
Anthropic 向美國參議院指控阿里巴巴以 2.5 萬個假帳號對 Claude 發動史上最大規模蒸餾攻擊,六週內完成 2880 萬次對話,定點蒸餾 Claude 最值錢的軟體工程與自主代理能力。攻擊成本可能低於 $9 萬,卻撬動了數億美元的模型訓練競爭優勢。
Qualcomm 以39億美元全股票收購 Modular,買下 Mojo 語言和 MAX Engine 背後的技術。這筆交易劍指 Nvidia CUDA 護城河,但真正的落點在推理層,不是訓練端。
白宮要求 OpenAI 限制 GPT-5.6 部署,初期僅開放約 20 家經政府審批的企業。這是美國首次在模型發布前主動管制本土 AI 公司,Sam Altman 承認這套逐案審批模式行不通,但選擇配合換取未來公開發布路徑。
OpenAI 與 Broadcom 聯手揭露 Jalapeño,OpenAI 第一顆自研推論 ASIC,九個月從設計到 tape-out,用自家 AI 模型協助晶片設計,目標 2026 年底部署。這場佈局的核心是推論端成本重組,不是要幹掉輝達。
Bloomberg 6月24日報導,Jonas Adler(AI 編碼)與 Alexander Pritzel(預訓練)即將離開 Google 投奔 Anthropic,五週內已有四波出走。Alphabet 市值蒸發 2700 億美元,但真正的損失是預訓練、編碼、科學研究三條核心研究線同時失血。
OpenAI 於 6 月 22 日發布 GPT-5.5-Cyber,Daybreak 計畫已找出 24 個 Linux 核心漏洞、5 個 Chrome V8 可利用漏洞、10 個 Safari 漏洞。CyberGym 85.6% 的分數好看,但 ExploitGym 39.5% 才是那個讓 OpenAI 必須限制存取的真正原因。
Anthropic 於 6 月 23 日推出 Claude Tag,讓 Claude Opus 4.8 以持久記憶的頻道隊友身份進駐 Slack。65% 代碼生成率是 Anthropic 自家數字,未有獨立驗證。Token 成本、遷移期限與企業資安邊界,才是工程師需要看清的三個核心問題。
Google 在 5 月 19 日的 I/O 承諾 Gemini 3.5 Pro「下個月」全面開放,六月二十四日仍只在 Vertex AI 企業預覽階段,正式定價都未公開。預測市場估本月底前發布機率 50-55%。2M token context、Deep Think、估算每百萬 token $15/$60 的成本,這個等待值多少?
SK 海力士六月二十四日向韓國金融監督院提交 ADR 申請,七月十日預計在 Nasdaq 開交,募資上限 290 億美元,全數用於龍仁半導體叢集擴建。這不是缺錢,是搶估值。KOSPI 本益比 8 倍對比 Micron 的 15 倍,說明了一切。
Tenet Security 揭露全新攻擊手法 Agentjacking:攻擊者在 Sentry 植入假錯誤報告,Claude Code、Cursor、Codex 以 85% 成功率乖乖執行駭客指令,2,388 家公司 DSN 已暴露。Sentry 拒絕從根本修復,漏洞持續開放中。
Fable 5 的免費試用今日結束,API 定價每百萬輸出 50 美元是 Opus 4.8 的兩倍。30 天強制資料保留政策、安全分類器的領域落差、以及 Mythos 5 的雙軌架構,是工程師在切換前需要理解的三個關鍵點。
Getty Images 宣布與 OpenAI 簽署多年展示協議,授權圖片進入 ChatGPT 搜尋功能,GETY 股價盤前漲逾 167%。這份合約更像是英國法院敗訴後的策略轉向,值得追蹤的是授權模式能否擴散到整個圖庫行業。
Z.ai(前智譜 AI)發布的 GLM-5.2 在 SWE-bench Pro 拿下 62.1 分,超過 GPT-5.5 的 58.6,API 定價僅 4.40 美元/百萬輸出 token,相當於 GPT-5.5 的六分之一。MIT 授權讓企業可以直接下載微調,搭配 Fable 5 出口管制造成的供給缺口,時機非常精準。
Reuters Institute 2026 年報告:全球 10% 成年人每週用 AI 看新聞,但點回原始報導的只有 4%。Google 自然搜尋流量已跌 33%,出版商預估未來三年再跌 43%,誰在受益、誰在挖坑?
Samsung Electronics 宣布對全韓員工及全球 DX 事業部部署 ChatGPT Enterprise 與 Codex,成為 OpenAI 最大企業合約之一。三年前一場原始碼外洩事件,三星封禁了所有生成式 AI,如今走出了一個完整的弧線。
Anthropic 的 Project Fetch Phase 2 顯示,Claude Opus 4.7 自主撰寫四足機器人控制程式碼的速度比無 AI 輔助的人類快了 37.7 倍,程式碼量也僅需人類的十分之一。機器狗最終沒有撿到球。這個結果既是里程碑,也是邊界的精準標示。
美國聯邦能源管理委員會對六大電網下達強制說明令,要求在 60 天內修訂 AI 資料中心的並網規則。但監管文件跑得再快,也快不過 160 週交期的電力變壓器。
Google、Microsoft、Hugging Face 聯合 11 家科技大廠,在 6 月 17 日發布 ARD(Agentic Resource Discovery)開放規格。AI 代理從此能用自然語言查詢,在執行期動態找到正確工具,就像 DNS 讓瀏覽器自動找到伺服器,結束「手動安裝再使用」的時代。
Qualcomm 傳出以 80 至 100 億美元收購 AI 晶片新創 Tenstorrent,後者由傳奇晶片設計師 Jim Keller 領軍,以 RISC-V 開源架構挑戰輝達的 CUDA 霸權。若交易成真,Qualcomm 將一口氣跨入 AI 資料中心晶片市場,同時押注 RISC-V 成為未來伺服器端主流架構。
AlphaFold 共同開發者、2024 年諾貝爾化學獎得主 John Jumper 宣布離開 Google DeepMind,加入 Anthropic。在 AI 人才爭奪戰激烈化的當下,這是繼 Noam Shazeer 後又一名頂尖研究員出走 Google,轉投競爭對手懷抱。
OpenAI S-1 招股書財報本週公開:Q1 營收 57 億美元,年增三倍,但非 GAAP 虧損率高達 -122%。ChatGPT 週活用戶停在 9 億,Anthropic 差距只剩 9 億美元,IPO 估值目標仍是 1 兆美元。
封禁進入第七天,白宮開出具體條件:Fable 5 復機前必須消滅所有越獄手法。資安研究員一致回應:語言模型護欄的本質決定了這個要求在技術上做不到,而 Dario Amodei 已拒絕政府提出的兩個選項。
SpaceX 首次取得穆迪、惠譽、標普三大投資級評級,準備發行 200 億美元公司債,置換今年二月收購 xAI 時的過橋貸款。評級基礎是 Alphabet 與 Anthropic 合計 750 億美元的長期合約,儘管公司第一季淨虧損 42.8 億美元。
Google Antigravity CLI 6 月 18 日正式取代 Gemini CLI,免費用戶即時失去訪問。Apache 2.0 開源工具在一年多後走入歷史,AI 編程工具市場全面進入閉源時代。
Transformer 共同作者、Gemini 前期訓練負責人 Noam Shazeer 宣布加入 OpenAI。Google 兩年前花 27 億美元把他從 Character.AI 買回,如今人才再度出走,OpenAI IPO 前的人才爭奪正式進入新局面。
Jensen Huang 在 VivaTech 2026 開幕首日宣布 200 億美元歐洲 AI 基建計畫,3,000 exaflops Blackwell 算力跨八國部署。Fable 5 出口管制剛剛點燃歐洲主權 AI 危機感,黃仁勳選在此刻大手筆押注。
SpaceX IPO 掛牌四天就出手,以 $600 億全股票收購 AI 編程助理 Cursor,成為史上最大 VC 新創收購案。Cursor 年化收入 $40 億、逾百萬付費用戶,接入 Colossus 後直衝 Claude Code 與 Codex。
美國商務部一張出口管制令讓 Fable 5 全球斷線,加拿大總理 Mark Carney 在 G7 峰會把這次事件比作 2008 金融危機的系統性風險,呼籲建立 AI 主權基礎設施。一張行政命令就能讓全球用戶斷線,這個風險該由誰承擔?
美國42州檢察長聯手對OpenAI發出傳票,要求交出ChatGPT討好用戶設計、未成年保護機制與健康資料處理的完整紀錄。三週前OpenAI才剛遞交IPO機密申請,目標估值一兆美元。當上市時程撞上跨州司法調查,OpenAI還能照原計畫走下去嗎?
Claude Fable 5 上線三天後,美國商務部以國安理由發出出口管制令,Anthropic 被迫對全球用戶關閉服務。觸發點是一個 Unicode 同形字 Jailbreak 示範,洩露的系統提示長達 12 萬字元。
高盛六月發布《追蹤兆美元》報告,預測 AI 基礎建設 2026 至 2031 年累計支出達 7.6 兆美元。算力佔 5.1 兆,NVIDIA 獨拿 75%;電力是最小預算,卻是最卡的瓶頸。
HarmonyOS 7 在 HDC 2026 正式發布,小藝升級為系統層 AI 代理人,搭載 Agent Framework 2.0,整合逾 2,100 項系統能力,任務完成率超過 90%,行動 OS 進入 agentic 時代。
KPMG 一份宣揚 AI 代理人的報告,被 GPTZero 發現 40 條引用標題根本不存在。UBS、NHS、英國交通局都被假引用牽連,報告已下架,諮詢公司銷售 AI 治理服務時,自己報告的可信度先出了問題。
6 月 12 日傍晚,美商務部以一個「非通用型越獄」為由,下令 Anthropic 停用旗下最強兩款 AI 模型 Fable 5 與 Mythos 5。Anthropic 照辦了,但同時明確表示不認同這個決定,這起事件正在改寫 AI 出口管制的邊界。
6 月 15 至 17 日,OpenAI 的 Sam Altman、Anthropic 的 Dario Amodei、Google DeepMind 的 Demis Hassabis 將同台出席法國埃維昂 G7 峰會,G7 史上頭一次。背後是美國拒絕 AI 多邊協議、歐洲搶奪 AI 主權的路線裂縫,也是兩家估值逾 9650 億美元 AI 公司上市前的一次政治站台。
OpenAI 宣布收購德國新創 Ona(前身為 Gitpod),把持久雲端沙盒技術整合進 Codex,讓 AI 代理程式可以自主工作數小時甚至數天。這是 OpenAI 2026 年第六筆收購,直接瞄準 Anthropic 在企業自主編程領域的優勢。
《華爾街日報》6 月 11 日報導,OpenAI 正研究大幅削減 API token 費率,直接原因是 Anthropic 旗下 Claude Code 爆紅推動首季盈利。當 AI 服務定價進入對抗階段,開發者和企業採購方的談判籌碼正在增加。
Jeff Bezos 與 Vik Bajaj 創立的 Prometheus,6 月 11 日以 120 億美元 B 輪融資、410 億美元估值走出隱秘狀態。公司的目標:做「人工通用工程師」,用 AI 設計噴射引擎、藥物分子和半導體元件,把 LLM 對文字的推理能力搬進實體工程世界。
AI 正在創造大量真實的經濟價值,但 GDP、CPI、勞動力統計全部看不見。一份遺囑草稿的成本從律師費 500 美元崩塌到 token 費 0.5 美元,統計系統卻把這讀成「服務業產出下降」。如果美聯儲繼續依賴這把壞掉的尺,貨幣政策將在黑暗中摸索。
Anthropic 在 6 月 9 日把 Mythos 級別的模型首次公開上線。Fable 5 一天完成了工程師團隊兩個月的 Ruby 遷移任務,分子生物學盲測中 80% 時間優於現有蛋白質模型,但帶著三道護欄,有些請求會轉給 Opus 4.8 處理。
Google DeepMind 在 6 月 10 日開源 DiffusionGemma 26B-A4B,把影像擴散技術搬進語言模型:每次前向傳播同時生成 15–20 個 token,H100 上跑出每秒 1000+ tokens,比同尺寸自回歸模型快 4 倍。速度有代價:輸出品質低於標準 Gemma 4。
6 月 9 日,Anthropic 正式發布 Fable 5,第一款對外開放的 Mythos 級別模型。分析評測破 90%,比 Opus 4.8 高出 10 分;SWE-Bench 80.3%;定價每百萬 token $10/$50,並內建安全分類器將高風險請求路由至 Opus 4.8 做為降階備援。
摩根士丹利六月十日報告:全球 AI 相關債務發行規模今年將翻倍至 5700 億美元。截至 5 月底已達 2360 億,比去年同期多出四倍。四大超大型科技廠今年資本支出合計 7000 億,科技公司首度大規模轉向債市。
SoftBank 以 OpenAI 13% 股份為抵押,尋求六十億美元保證金貸款的計劃今日宣告暫停。銀行無法替未上市公司的股份定價,連八千五百億的帳面估值也說服不了信貸委員會。
May 2026 Ramp AI 指數追蹤逾五萬家美國企業帳單,首次顯示 Claude 企業市佔 34.4% 超越 OpenAI 的 32.3%。Claude Code 驅動四倍成長,AI 企業市場的默認選項正在轉移。
歐盟 AI Act 將於 8 月 2 日正式進入全面執法階段,違規最高罰款 3500 萬歐元或全球年營收 7%。歐盟剛成立 60 名頂尖科學家組成的執法專家小組,78% 的企業至今毫無合規動作。
WWDC 2026 今日登場,Tim Cook 最後主題演講揭開 Siri 全面換骨:核心模型換成 Google Gemini 定製版,Apple 每年約付 10 億美元授權費,iOS 27 用戶可自選 ChatGPT、Claude 或 Gemini 驅動助理功能。
北京 AI 新創 Moonshot AI 正洽談 300 億美元估值、融資 20 億,半年前身價僅 43 億。Kimi 月收入三月翻倍,中國 AI 四強合計估值已逾 1800 億美元。
美國首部聯邦 AI 監管討論草案出爐,國會跨黨派提案 269 頁框架文件,擬三年凍結各州 AI 開發立法,強制年收 5 億美元以上業者每半年接受審計,違規最高每天罰款百萬美元。工會、消費者組織與眾議院民主黨委員會同步反對。
OpenAI 6月6日推出 Lockdown Mode,用一個開關鎖定 ChatGPT 的對外連線,降低 prompt injection 資料外洩風險。所有帳號都能啟用,但它有一個根本限制必須了解。
Gemini Enterprise 用量超乎內部預測,Google 轉向 SpaceX 前 xAI 的 Colossus 叢集求援。每月 9.2 億美元、三年 290 億,這份合約說的是 AI 算力短缺比任何人預期的都嚴重。
SPCX 路演啟動一天就認購超額,$75B 募資將超越 Saudi Aramco 創下史上紀錄。Goldman Sachs 預估 2030 年 AI 算力業務貢獻 $322B 營收,占比 68%。市場買的已經不是火箭公司。
Claude 完成任務的時間跨度每四個月翻倍,Anthropic 工程師的程式碼產出已是五年前的八倍。這家即將 IPO 的公司說:在失控之前,世界需要一個暫停機制。
劍橋大學宣布,全球第一款核心成分完全由 AI 設計的冠狀病毒疫苗完成 39 人安全試驗,AI 超抗原能覆蓋整個冠狀病毒家族,研究團隊已將同一技術延伸至流感與伊波拉。
Sam Altman、Dario Amodei、Demis Hassabis、Mustafa Suleyman 四位AI龍頭執行長六月四日共同簽署公開信,要求美國國會強制篩查合成DNA訂單,理由是AI已大幅降低生物武器的製造知識門檻,且現有工具能協助使用者規避篩查。
這家靠創始人私房錢打天下的中國 AI 公司,準備史上第一次開門迎接外部投資者。74 億美元、估值 590 億,騰訊與寧德時代領投,背後的理由只有一個:AI Agent 燒的錢,靠對沖基金撐不住了。
Anthropic 六月一日向 SEC 秘密遞交 S-1,最快秋季掛牌。年化收入從去年七月的 40 億美元飆至今季 500 億美元以上,Claude Code 是主要推手。若順利上市,將是 AI 純玩家中市值最大的公開交易公司。
Anthropic Mythos Preview 在 Firefox 單項測試產出 181 個有效 exploit,前代 Opus 4.6 只有 2 個。Project Glasswing 現擴展至 200 家機構,含北約和歐盟資安局,但六千個嚴重漏洞中只有 75 個完成修補。
Microsoft Build 2026 最大的訊號:微軟自建七款 MAI 模型,Project Polaris 將在 8 月前取代 GitHub Copilot 的 GPT-4 Turbo,並簽下 96.9 億美元國防部合約,代理框架全面開源上陣。
台灣長照機構還在靠紙本、Excel、LINE 群組處理每天的個案、出勤、生命徵象與交通車。KotoCare 是一套可以跑在自己電腦上的 MVP——個案管理、AI 查詢、CSV 報表、電子白板,資料都在資料庫裡,不是假的 Demo。
NVIDIA 在 Computex 2026 發表首款 ARM 筆電 SoC N1X,搭載 6,144 CUDA 核心與 1,000 TOPS AI 算力,直攻 Qualcomm Snapdragon X Elite 市場,Dell、聯想、華碩同步跟進。
GitHub Copilot 6 月 1 日起全面改用 AI Credits 計費,1 credit = $0.01,聊天與 agent 工作流都要扣點。Code completion 維持免費,但重度 agent 使用者可能面臨費用跳升。
SoftBank 宣布向法國投資高達 750 億歐元建設 AI 資料中心,首期部署 3.1 GW 算力,孫正義與馬克宏聯手,要讓法國成為歐洲 AI 基建核心。
Anthropic 在 Opus 4.7 發布後僅 41 天再推 Opus 4.8,代理編碼評分升至 69.2%,快速模式定價砍至三分之一,並首度開放動態工作流程讓單一任務調度數百個平行代理。Mythos 級別模型也將在數週內跟進。
Dell Q1 FY27 財報:AI 伺服器營收 161 億美元,年增 757%;總營收 438 億,年增 88%;股價單日收漲 33%。全年 AI 伺服器目標上修至 600 億美元。
同一家公司,三個月前剛談完 300 億,現在以 650 億美元收尾,估值衝上 9650 億。Anthropic 成為全球估值最高的 AI 新創,OpenAI 落後。
Google DeepMind 執行長 Demis Hassabis 在 Google I/O 2026 給出最新 AGI 時間表:最快 2029 年,比他一年前的預估提前五年以上。他說人類正站在奇點山腳。
CNN 向紐約聯邦法院控告 Perplexity,指其未授權抓取逾 1.7 萬篇新聞。這是電視網首件 AI 著作權訴訟,判決將直接影響媒體業授權談判生態。
AI 工程師新創 Cognition 以 260 億美元估值完成 10 億美元融資,年化營收從一年前的 3700 萬美元暴增至 4.92 億美元。Devin 現在負責撰寫公司 90% 的程式碼,客戶涵蓋 Goldman Sachs、NASA、Mercedes-Benz。
伊利諾州議會 110:0 全票通過 SB 315,要求 OpenAI、Anthropic、Google DeepMind 每年接受第三方安全審計。OpenAI 和 Anthropic 雙雙公開背書,州長宣布將簽署。
Mistral AI 今天宣布與空中巴士及 BMW 簽署工業 AI 合作協議。BMW 要用 Mistral 訓練的大型工業模型加速碰撞模擬,空巴五年合約涵蓋商業航空到國防太空。歐洲資料主權正成為採購決策的核心條件。
北京開始管控私人企業的頂尖 AI 人才出境,適用對象從 DeepSeek、Manus 延伸到阿里巴巴。美國對晶片出口設限,中國現在鎖住的是人。
黃仁勳今天 Computex 宣布,Nvidia 年度台灣採購從五年前的 150 億跳升至 1000 億、目標 1500 億美元。台灣加權指數同日創收盤歷史新高,漲 1.7%。
Q1 營收 563 億美元、淨利 268 億,同一週還是裁了 8000 人。Meta 把省下來的人力預算直接搬去買 GPU 算力,規模衝上 2026 年 1450 億的資本支出,是科技業有史以來最大的 AI 基礎設施豪賭。
NVIDIA 公布 FY2027 Q1 財報,收入 816 億美元年增 85%,資料中心年增 92%。黃仁勳在法說會宣告「Agentic AI 已到來」,並揭露 Vera Rubin 平台出貨時程。股價盤後反跌的真正原因,是市場預期早就把超預期定價進去了。
5 月 25 日,教宗良十四世在梵蒂岡發表首份以 AI 為主題的通諭,邀請 Anthropic 共同創辦人同台,警告 AI「去人化」風險,要求人的尊嚴作為評估 AI 發展的最高準則。
DeepSeek 宣布將 V4-Pro API 的 75% 折扣永久化,輸出 Token 每百萬僅 $0.87,比 GPT-5.5 便宜 34 倍。這不只是降價,是一場針對西方 AI 定價護城河的定點清除。
TeamPCP 組織用一個只活了 18 分鐘的毒 VS Code 擴充套件,讓 GitHub 損失 3,800 個內部庫、OpenAI 兩台設備遭入侵、Mistral 原始碼在暗網公開兜售。AI 開發環境已成高價值目標。
Anthropic 公布 Project Glasswing 首月成果:Claude Mythos Preview 在 1,000 個開源專案中找到逾一萬個高危漏洞,90.6% 確認為真實威脅。現在的瓶頸,已從發現轉移到修補。
OpenAI 在新加坡設立首個海外 Applied AI Lab,投入逾 2.34 億美元,IMDA 同日更新代理 AI 治理框架,Google 同場宣布國家 AI 夥伴關係。
OpenAI 今日向 SEC 遞交機密 S-1 申請,目標估值一兆美元,由高盛和摩根士丹利主承銷。月收入 20 億美元、9 億週活躍用戶,這可能是科技史上最大規模的 IPO。
5 月 21 日,距簽署只剩幾小時,Trump 叫停 AI 模型 90 天政府預審的行政命令。Musk 和 Zuckerberg 當晚進言反對,白宮的安全盤算再次輸給矽谷的速度焦慮。
Anthropic Q2 季度營收預估從 48 億暴增至 109 億美元,同時與 SpaceX 簽下每月 12.5 億美元算力合約。這份三年期大單的年金額,幾乎等同 SpaceX 全公司一整年的收入。
OpenAI 的通用推理模型推翻了困擾數學界 80 年的埃爾德什單位距離猜想,這是 AI 首次在沒有專門訓練的情況下,獨力解決活躍數學領域中的公開難題。
Google I/O 2026 那張圖說明了一件事:AI 的使用量不是靠人工輸入長大的。每月 3.2 quadrillion token、7 倍年增長,背後是無數條自動化 pipeline 在不間斷地運行。問題不是「你會不會用 AI」,而是「你有沒有讓 AI 自動替你工作」。
Google 在年度開發者大會宣布搜尋引擎 25 年最大改版,推出 Gemini Spark 全天候個人 AI 代理人。Gemini 月活用戶已達 9 億,你的搜尋習慣即將徹底翻轉。
OpenAI 宣布採用 C2PA 標準並整合 Google 的 SynthID 不可見水印技術,同時推出公開驗證工具。兩大 AI 競爭對手罕見攜手,能否真正解決 AI 深偽問題?
Anthropic 以逾 3 億美元收購 SDK 自動化工具商 Stainless,這個 OpenAI、Google、Cloudflare 都在用的開發者基礎設施從此易主,並宣布關閉所有對外服務。AI 代理時代的連接層競爭,現在才剛開打。
Google I/O 2026 主題演講發布 Gemini Intelligence 嵌入 Android 系統層、Googlebook 筆電新品類,以及三星合作 XR 眼鏡,模型排名雖落後 Claude Mythos,但 Google 押注的是分發規模。
在銀行業,AI 最先動手的不是需要判斷力的崗位,而是那條把資料從 A 搬到 B 的傳遞鏈。你每天花多少時間在搬運?
跨界能力會變成新的核心競爭力。不是因為這話聽起來好,而是因為 AI 接管了所有「只需要一種語言」的工作之後,剩下的全是翻譯問題。
Anthropic 最強未公開模型 Claude Mythos Preview,已在主流作業系統和瀏覽器找到數千個零日漏洞。12 家科技巨頭聯手防禦,但上線第一天就遭未授權存取。
明天 Google I/O 開幕,洩漏的 Gemini Omni 整合文字、圖片、影片生成,但能否追上 Claude Mythos 的 93.9% SWE-bench 分數?
三個月前估值 3800 億,現在談 9000 億。Anthropic 的新一輪 300 億美元融資,到底是市場理性還是另一波估值泡沫?
OpenAI 共同創辦人 Greg Brockman 正式接掌產品策略,將 ChatGPT、Codex 與 API 合併為單一 Agentic 平台。Google I/O 開幕前四天的這場整合,是守住 9 億用戶優勢的關鍵一棋嗎?
Cerebras 以 185 美元定價、募資 55.5 億美元,首日收漲 68%,市值衝上 950 億美元。WSE-3 晶片比 GPU 快 15 倍,OpenAI 和 AWS 都是客戶,AI 晶片市場正在重組。
OpenAI 與 Plaid 合作,讓 ChatGPT Pro 用戶連結逾 1.2 萬家金融機構,AI 直接讀取消費記錄與投資組合。功能強大,但用戶的第一反應是:這樣真的安全嗎?
Anthropic 與蓋茲基金會宣布四年 2 億美元合作,目標把 Claude 部署到全球醫療、教育、農業前線。兩邊都承諾公開成果資料,AI 公益項目很少做到這點。
美中峰會給 Nvidia 開了一扇門:Alibaba、Tencent、ByteDance 等十家企業獲准購買 H200,每家上限 75,000 顆。但北京暗示不准買,晶片一顆都沒出貨。
法庭文件顯示,OpenAI 執行長 Sam Altman 在與 OpenAI 有業務往來的九家公司中持有逾 20 億美元個人股份,Helion Energy 一項就佔 17 億美元。馬斯克訴訟今日進入結辯,可能影響這家估值逾 1 兆美元 AI 龍頭的上市計畫與治理結構。
Mira Murati 創辦的 Thinking Machines 在 2026 年 5 月 11 日發布 TML-Interaction-Small,延遲 0.40 秒,比 OpenAI 快三倍。這不是靠更快的硬體——而是他們從根本上放棄了管線架構,讓模型自己學會怎麼對話。這個選擇解釋了一切。
2026 年 5 月,Anthropic 在舊金山、倫敦、東京三城舉辦「Code with Claude 2026」全球開發者大會。沒有新模型發布,而是一套涵蓋算力、智能體、編程工具與成本的整合更新——AI 的戰場從模型參數轉向了能不能真的用起來。
不是測試你懂不懂 RAG 或 Prompt Engineering,而是問你:在真實的 AI 產品工作中,你的判斷力夠嗎?全新的未來 AI PM 技能檢核,用 20 道情境題診斷你的 5 大核心能力——產品思維、AI 素養、數據分析、溝通協作、執行力。
Anthropic 產品負責人 Cat Wu 描述了 AI 時代產品管理的全新節奏:角色正在融合、Prototype 優先於文件、以數天而非數月為迭代週期。讀完這篇文章,我深刻回想起兩年前自己在企業 AI 團隊中「什麼都做」的那段歲月,以及 Peter Deng 談到的「復仇者聯盟」式團隊建構哲學。
台積電股價從 2025 年 4 月的約 164 美元漲到 2026 年 4 月的 387 美元,漲幅 137%。這篇拆解 AI 晶片需求、CoWoS 封裝瓶頸、NVIDIA 取代蘋果成為第一大客戶,以及 165 億美元的美國建廠計畫如何共同推動這波行情。
2026 年的 AI 競爭本質是 Harness 工程的博弈。本文深度解析生產級 Agent Harness 的十二大核心模組、主流框架設計哲學,以及 AI 架構師必須面對的七大架構抉擇。
GPT-5.5 昨天(4 月 23 日)正式發布,在 14 項基準測試拿下第一,效率提升 40%。而黃仁勳與 NVIDIA 在這背後的算力押注,規模同樣驚人——10 GW、最高 1000 億美元。
Ilya 說壓縮即學習,Freedman 發現只有多項式增長的 monoids 才能被壓縮。如果 Persona 可以投影到 nilpotent 子結構,那 PPV 就不只是統計擬合——而是有代數結構支撐的人格壓縮。
2026 年 4 月 17 日,Anthropic 正式推出 Claude Design,一款以對話驅動的 AI 視覺設計工具。使用者只需用文字描述需求,即可生成互動原型、簡報、單頁行銷頁等視覺成果。背後驅動力是 Claude Opus 4.7,Anthropic 迄今最強的視覺模型。消息一出,Figma 股價單日重挫 5%。
大多數 AI Agent 每次對話結束就「失憶」。Hermes Agent 不一樣——它會把你教給它的東西記下來,下一次用得更好。這是 NousResearch 在 2026 年推出的開源 Agent 框架,三層記憶體架構讓它越跑越聰明。
Harness Engineering 是 AI Agent 架構中的執行底層。這篇文章介紹 Harness 的核心設計,涵蓋執行控制、可觀測性、Hook 機制、工具沙盒與狀態管理。
當 AI 研究者說 LLM「像人類」,他們指的是哪些人類?哈佛 2023 年研究用 262 個跨文化問卷變數、94,278 名全球受訪者,得出關鍵結論:ChatGPT 的文化心理立場最接近 WEIRD 西方民主國家,與非 WEIRD 文化的相關係數高達 r = -.70。
LLM 真的能模擬「你」嗎?從 Generative Agents 到 BehaviorChain,再到以心理計量向量(PPV)驅動的 RAG-Free 數位孿生,本文深度解析三大方向的技術路線、核心差異與未解難題。
前 Tesla AI 主管 Andrej Karpathy 提出用 LLM 維護一座個人 Wiki,取代傳統 RAG 的「每次重新搜尋」模式。這套三層架構如何讓知識像複利一樣累積?本文完整解析。
2026年4月,Google DeepMind 正式發布 Gemma 4,首度採用 Apache 2.0 授權,提供 E2B、E4B、26B MoE 和 31B Dense 四種規格。31B 模型在全球開放模型排行榜名列第三,支援 256K 上下文視窗與原生 Agentic 工作流程。本文完整解析 Gemma 4 的架構亮點、各版本特色,以及開發者如何快速上手部署。
2026年3月底,Anthropic 在 npm 發布更新時意外夾帶 59.8MB 的 Source Map,導致 Claude Code 的底層程式碼全面洩漏。這不僅是一次工程失誤,更是企業級 Agent 架構、多層提示詞與臥底模式等設計細節的首次大解密。
AI 購物代理正從展示品變成真正的消費工具。Walmart 推出自研 AI 助手 Sparky,Target 與 Google Gemini 合作,Shopify 發布 Agentic Commerce 協議。當 AI Agent 開始替你刷卡,電商的遊戲規則正在被徹底改寫。
OpenClaw 創辦人 Peter Steinberger 從一個週末小專案出發,用 Anthropic 的 Claude 打造了 AI Agent 框架,卻因商標爭議被迫改名。這段從車庫到被 OpenAI 延攬的旅程,證明了在 AI 大航海時代,任何一個小小的想法都可能改變遊戲規則。
前 OpenAI 與 Tesla AI 總監 Andrej Karpathy 在最新《No Priors》訪談中分享「AI 精神病」經歷:數月未寫程式碼。本文解析其核心觀點,探討 Claws 背景 Agent 概念、Token 焦慮,以及 Software 3.0 時代軟體開發範式的轉變。
2026 年 3 月 Google 推出了 Stitch 更新。這款由 Gemini 驅動的 AI 原生設計畫布不僅能透過自然語言生成 UI,更新增 Voice Canvas 語音編輯。它將如何徹底顛覆 Figma 與設計師的未來工作流?
OpenClaw 的出現讓大家看到「assistant 不只是聊天機器人」,而是一個常駐的代理層。但真正有趣的是它的變種(如 NanoBot, CoPaw, IronClaw),從基礎設施到極端硬體部署,五大路線正在回答下一代 AI 助理的真正形狀。
Agent 聽起來很酷,但在企業環境做 Agent 產品很容易踩坑。這是我親身經歷的五個設計陷阱。 2025 年是 AI Agent 元年。到了 2026 年,每個企業都在問:「我們也要做 Agent 嗎?」 但「做 Agent」和「做好 Agent 產品」是兩件完全不同的事。 這篇分享我在設計...
主管問你「AI 到底值不值得投資?」時,你需要拿出數字。這是我用來證明 GenAI 價值的四個指標框架。 每一個做 GenAI 的 PM 都會遇到這個問題: > 「AI 很好,但怎麼證明它值得投資?」 在銀行,這個問題更尖銳。因為每一筆 AI 的投資都需要和傳統 IT 項目競爭預算——而傳統項目...
企業級 prompt 跟個人使用完全不同。結構化、版本控制、多角色設計——這些是我踩過的坑。 個人用 ChatGPT 寫 prompt,最多就是「幫我寫一封信」。 企業用 LLM 寫 prompt,是一整套工程實踐。 這篇分享我在企業場景中做 prompt engineering 時,累積的幾個...
在銀行建 RAG 系統,chunk 策略、embedding 模型、retrieval pipeline 三個決策點怎麼選?實戰經驗分享。 RAG(Retrieval-Augmented Generation)是 2024-2025 最熱門的企業 AI 架構。但真正在企業環境中建過 RAG 系統...
想從傳統 PM 進行產品經理轉型?AI 產品經理需要寫程式嗎?結合 OpenAI 副總裁 Peter Deng 與 Vibe Coding 哲學,拆解你缺少的 AI PM 技能樹與思維。 我被問過最多次的問題就是:「AI 產品經理跟傳統 PM 到底差在哪裡?如果我要進行產品經理轉型,需要會寫程式...
金融業 AI 轉型不是選個模型就好。資安、法遵、資料治理——這是將銀行 AI 系統從 1 推向 100 的必經之路,也是 AI 落地挑戰最真實的面貌。 在新創公司開發 Generative AI 產品,你可能靠著 Vibe Coding(與編輯器對話直接產出程式碼)三天就能上線一個 Chatbo...
擔心 AI 功能幾個月後就被開源模型取代?本文教你如何透過預判模型進化的思維進行 AI 專利申請,打造別人抄不走的 GenAI 產品護城河。 大多數 PM 一聽到「AI 專利申請」,直覺反應都是:那屬於「底層演算法科學家」或 RD 研發部門的事,與產品經理無關。 但我主導的最高價值專利,往往是從...
不只是開票寫規格,真實的 AI PM 工作內容究竟長怎樣?從單純的 PM 轉向全端 Builder,帶你走一遍銀行生成式 AI 產品開發流程的殘酷日常。 很多人聽到「AI 產品經理」,第一反應往往是:「所以你整天都在用 Python 寫模型嗎?」 其實不是。我花最多時間在『建造』。 誠如 Ope...
同一個時代,同樣叫做工程師,有人因 AI 失去工作,也有人因 AI 找到工作。決定你在哪一邊的,不是學歷年資,而是調整速度。 同一個時代,同樣叫做工程師,有人因 AI 失去工作,也有人因 AI 找到工作。決定你在哪一邊的,不是學歷年資,而是調整速度。新職缺已經靜靜上線了 ——— Block 剛宣...
過去一年我也是這樣帶團隊,但發現部份經驗與好奇心不足的人會對這種工作型態無所適從,這大概就是一種挑選未來人才的方法。 過去一年我也是這樣帶團隊,但發現部份經驗與好奇心不足的人(例如一些實習生)會對這種工作型態無所適從 個人感覺,這大概就是一種挑選未來人才的方法 --- Anthropic 的 C...
我們在做一個「真的會上線、真的有人用」的 AI Agent 平台:把 GenAI 串進工作流程,從資料處理到 tools & workflows 的調度。 【招募實習生|海外 AI Agent 平台|全端/後端/GenAI】 我們在做一個「真的會上線、真的有人用」的 AI Agent 平台:把 ...
做了一個 AI Browser,能自動記錄所有思考過程、查詢軌跡、自動判斷是否需要截圖,並在最後輸出一份調查報告。 做了一個AI Browser,能自動記錄所有思考過程、查詢軌跡、自動判斷是否需要截圖,並在最後輸出一份調查報告 https://youtu.be/Hk42hV7q2Q?si=Rp9...
過去「AI」在學術圈帶有負面標籤,Geoffrey Hinton 也曾因做神經網路被強烈質疑。如今他獲得圖靈獎與諾貝爾獎,AI 正在改變世界。 過去曾有段時間,「AI」這個詞在學術圈(特別是幾次 AI 寒冬之後)帶有負面標籤,資訊工程領域的一些專家學者如果聽到有人講 AI,可能會覺得這個人太會吹...
AI 不再只是 demo 的玩具,而是變成雲端基礎設施的一環。工具在變,角色就有機會跟著變。 Google 把 Gemini 3 Pro 和 Antigravity 推上來之後 我開始重新思考「開發者跟 AI 的關係」這件事 這一波更新,很直白地釋出一個訊號: AI 不再只是 demo 或 si...
Perplexity面對的是一個「位置」的考驗,一邊要扛起「AI 搜尋新一代」的期待,一邊又被各種內容方用法律與商業談判來拉扯。 [關於Perplexity的困境] 在Perplexity剛出世的時候我就覺得我們團隊也做得出一樣的產品,甚至能一樣好 事實上,只要是一般夠有 sense 的開發團隊...
在 DevFest Taipei 2025 分享真實上線的 AI 業務教練平台——多 Agent 協作、Persona World、Ontology + GraphRAG,打造 24/7 個人化培訓系統。
11/30 將在 Google GDG 舉辦的 DevFest Taipei 2025 分享 AI Agent team 落地應用,歡迎報名參加。 11/30 DevFest Taipei 將分享真實在生產環境使用的業務訓練Agent team應用 11/30 10:30 台大博雅教學館博201見
GraphRAG 以圖譜化知識結構取代單點檢索,藉由節點與邊的關聯輔助生成,既能維持上下文一致,又具備多跳推理能力。 GraphRAG 以知識圖譜串聯記憶,重塑智慧客服推理能力 傳統 RAG 模型仰賴向量檢索,當對話延展過長或主題跨度太廣,語意易被割裂,導致 LLM 回應冗長卻偏離重點。Grap...
今年初 6 項新型專利已全部獲得核准,上個月再次提交 5 項專利。這是生成式 AI 落地爆發的一年。 至此,今年初6項新型專利已全部獲得核准,其中2項為一案兩請(新型+專利) 上個月再次提交5項專利,預計1項新型,4項一案兩請 這是生成式AI落地爆發的一年
一位銀行 GenAI 產品經理如何從業務痛點出發,設計出能自動建構知識圖譜的 LLM 系統,並成功取得新型專利?本文分享從需求到專利的完整思路。 大多數人對知識圖譜的印象是:需要大量人工標記、需要事先定義本體(ontology)、需要一群領域專家持續維護。 這在金融業尤其是個大問題。 銀行的業務...
11/30 在 Google GDG 舉辦的 DevFest Taipei 2025 分享 AI Agent team 落地應用,免費入場,歡迎報名。 11/30 我會在Google GDG舉辦的DevFest Taipei 2025分享AI Agent team 落地應用,歡迎有興趣的朋友們來...
這是我看過的講解 Attention is all you need 的影片中講解最好的一部。 這是我看過的講解Attention is all you need的影片中講解最好的一部 https://www.youtube.com/watch?v=VaEjGnHgOI&t=1274s
Jason Wei 這段演講醍醐灌頂,聽到起 goose bump,尋找 AI 場景確實應該用這個系統化的方法。 Jason Wei這段演講醍醐灌頂,聽到起goose bump,尋找AI場景確實應該用這個系統化的方法
今年我在 iThome Hello World 開發者大會帶來四場密集的 AI 實戰分享,從 MCP 生態系、GraphRAG 到企業級 LLM 防禦機制,探討大型語言模型落地企業的核心技術。 在今年的 iThome Hello World 2025 開發者大會上,我一口氣帶來了四場跟 AI 實...
把 AI 模型的 temperature 設為 0 就能得到完全一致的結果嗎?答案是否,Thinking Machine Lab 的研究揭示了根本性的原因。 Thinking Machine Lab (Mira Murati創立的startup,在還沒有任何產品和工作方向時,光是Mira Mur...
當 GenAI 系統被用來查詢敏感資料,如何防止惡意使用者繞過安全機制?本文介紹銀行 AI 產品經理如何設計動態存取控制專利,用 AI 守護 AI。 在銀行導入生成式 AI 的過程中,最讓我夜不能寐的問題不是模型效果,而是安全性。 一個能查詢客戶資料的 AI 聊天機器人,如果被有心人士透過特製 ...
像極了轉扭蛋的 vibe coding 御三家,OpenAI 的 Codex、Google 的 Gemini、Anthropic 的 Claude。 像極了轉扭蛋的 vibe coding 御三家: openai 的 Codex google 的 Gemini Anthropic 的 Claude
Nano Banana(Gemini 2.5 Flash 圖像功能)真的滿猛的,從改西裝到調整笑容和細節動作,精準度令人驚艷。 Nano Banana (Gemini 2.5 Flash 圖像功能)真的滿猛的 prompt 1: 改成穿西裝在攝影棚裡拍的證件照 prompt 2: 改成帶有專業感...
把生成式 AI、現代化金融科技、智慧金融應用變成可規模化的產品與服務,一起把金融 AI 做到海外市場。 尼爾斯在找隊友!我們要一起把金融 AI 做到海外市場(東南亞),兩個角色同步招募中 我們在做什麼 把生成式 AI、現代化金融科技、智慧金融應用變成可規模化的產品與服務,直接解決真實業務問題。 ...
前 OpenAI 產品副總裁 Peter Deng 深入解析產品本質、1 到 100 的增長策略、五種 PM 角色分類,以及在 AI 時代中最核心的無感智能化設計與提問能力。 身為 AI 領域的產品經理或技術人員,我非常信奉矽谷頂尖產品大師 Peter Deng(曾任職於 Facebook、In...
ChatGPT 的 Agent 操作都是即時顯示且具可解釋性,基本像盯著一位人類秘書操作電腦完成抽象任務。 Chatgpt出agent 看起來Agent收到指令後操作都是即時顯示在螢幕上,也有verbose因此具可解釋性,基本像盯著一位人類秘書操作電腦完成抽象任務 開發agent的成員在加入ag...
大型語言模型部署成本越來越高?本文分享一位銀行 GenAI Product Manager 如何透過模組化架構設計,讓 AI 系統可依需求客製,降低硬體負擔並提升彈性。 剛開始做企業 GenAI 產品的時候,我也曾經迷信「模型越大越好、功能越多越強」。 直到我看到實際的部署成本。 一個部署在企業...
傳統 DBA 靠經驗管資料庫,但在高併發、複雜負載的環境下,這不夠用。本文分享一位 GenAI Product Owner 如何設計多 AI 代理協作的資料庫智慧優化系統,並取得新型專利。 資料庫優化是一門黑魔法。 資深 DBA 靠的是多年累積的直覺:看到某個查詢 pattern,知道要加什麼 ...
在銀行導入 AI 知識庫查詢系統時,如何防止個資外洩又不犧牲回覆品質?本文介紹一個 GenAI Product Owner 設計的敏感資訊過濾與替換專利架構。 想像這個場景: 你終於把 RAG 系統上線了,客服人員用它查詢客戶資料、業務規則、內部 SOP……效果很好,大家都很開心。 然後法遵部門...
星際之門現在是一個 24 小時輪班建置的伺服器中心專案,當美國人也開始 24 小時在卷的時候,你就知道這場仗是輸不起的。 星際之門現在是一個24小時輪班建置的伺服器中心專案,當美國人也開始24小時輪班在卷的時候,你就知道這場AI領導地位的仗是美國輸不起的一場戰役
Google 發佈會密集地發表新產品展現態勢,在推出新功能的速度上,OpenAI 還是一間小公司。 一即全,贏者全拿 這段影片是Google這次發佈會的精華32分鐘版本,密集地發表新產品,就展現了態勢。如果以前AI技術發展對我來說是眼花撩亂的話,那麽這次就是壓的人無法喘氣 相較之下,在推出新功能...
Elon 認為學習知識後最重要的是想像力。芙莉蓮說魔法是想像的世界——Transformer 和生成式 AI 就是這樣的魔法。 2017年曾有新聞採訪Kobe,詢問他對Elon Musk的看法。當時Kobe提到,Elon認為學習知識後最重要的是想像力;無論你學了多少東西、看了多少書,如果缺乏想像...
理財專員的痛點是什麼?GenAI 如何讓他們在對話中即時生成個人化投資建議?本文分享一位銀行 GenAI Product Manager 的金融 AI 產品設計歷程與專利思維。 在銀行做 AI 產品,我花了很多時間跟理財專員(RM)聊天。 他們不缺努力,也不缺對客戶的了解。 他們缺的是:在客戶面...
我們的金融 AI 科技團隊正在尋找對 DevOps 與資料科學充滿熱忱的專業人員,攜手開發並落實生成式 AI 應用。 歡迎加入團隊,一起積極創造AI場景 ——— 我們的金融 AI 科技團隊正在尋找對 DevOps 與資料科學充滿熱忱的專業人員,攜手開發並落實生成式 AI 應用 工作內容: 1....
要求候選人在 60 分鐘內結合 LLM 與前端開發能力完成靜態網站,從「知識背誦」轉向「工具落地」。 生成式 AI 驅動技術面試革新 最近,我們將實習生技術評估提升到新層次: 要求候選人在 60 分鐘內,結合 LLM 與前端開發能力,完成一個自我介紹+OpenAI 提示工程指南的靜態網站 三位候...
今年是 AI Agent 的年,6/5-6/6 DevOpsDays 見——五種 Agent 行為模式:用 AI 打造未來 DevOps 生態系。 A deep dive into the latest insights and developments.
OpenAI 展示了四個重要創新:視覺微調、實時 API、模型蒸餾和提示快取,將更多的創新和控制權交到開發者手中。 OpenAI DevDay 2024: 一場屬於開發者的技術革新 就在今天,OpenAI 展示了四個重要創新:視覺微調(Vision Fine-Tuning)、實時 API(Rea...