Hermes Agent：越用越聰明的開源 AI Agent 框架

Hermes Agent 是 NousResearch 在 2026 年 2 月 25 日發布的開源 AI Agent 框架，發布幾週內就累積了 57,000 個 GitHub Stars，是今年成長最快的 Agent 開源專案之一。

它到底做對了什麼？我認為答案在於一個大多數 Agent 框架根本沒認真處理的問題：記憶體。

大多數 Agent 框架的盲點

現在的 Agent 框架設計邏輯普遍是這樣：接收請求 → 規劃 → 執行 → 輸出結果。然後對話結束，什麼都不留下。

你今天告訴 Agent「我的報告格式要這樣」，明天它又回到出廠設定。你上個月花了三個小時讓它學會一套資料分析流程，下次還得從頭來。

Hermes Agent 的設計想解決的就是這件事。

三層記憶體架構

Hermes Agent 的記憶體系統分三層：

第一層：Session Memory（工作記憶）

當前對話的上下文，跟一般 Agent 一樣。

第二層：Persistent Memory（持久記憶）

跨 session 儲存的使用者偏好、行為模式和背景知識。不是把所有對話紀錄都塞進 context——那樣 token 消耗會爆炸——而是用 SQLite + FTS5 全文搜尋索引，讓 Agent 在需要的時候主動搜尋自己的記憶庫。

第三層：Skill Memory（技能記憶）

這是最有意思的一層。當 Agent 完成一個複雜任務，它會自動把這個流程抽象成一份 skill 文件，下次遇到類似任務直接調用。技能會在使用過程中持續自我修正。

這三層疊在一起，讓 Hermes Agent 的行為有點像一個每天都在成長的員工，而不是每次都重新上工的臨時工。

底層模型：Hermes 4

Hermes Agent 的基礎是 NousResearch 在 2025 年 8 月推出的 Hermes 4 模型家族，基於 Meta Llama 3.1 架構，提供三種規格：14B、70B、405B。

幾個技術亮點：

131K token context window：能一次塞入整個 codebase 或超長文件
Hybrid Reasoning Mode：支援 <think>...</think> 標籤，可以在快速回覆和深度推理之間切換
35B MoE 變體：Mixture-of-Experts 架構，每次推理只激活 3B active parameters，在速度和能力間取得平衡
訓練規模：使用 1,000 個不同的 task-specific verifier 進行 rejection sampling，訓練資料從 100 萬筆擴展到約 500 萬筆

模型無關 + 跨平台部署

Hermes Agent 的另一個設計選擇是模型無關（model-agnostic）。它支援 200 多個 LLM provider，包括 OpenAI、Anthropic Claude、Nous Portal、OpenRouter、HuggingFace，也可以接本機的 local model。你不需要綁在任何一個 API 上。

更特別的是它的跨平台策略：一個 gateway，同時跑在 15 個以上的平台。

CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Email、SMS，甚至 DingTalk、飛書、WeCom、Home Assistant——部署一次，所有渠道都能用同一個 Agent 實例，共享同一套記憶體和技能庫。不用為每個平台各自維護一份 Agent。

這個設計對需要在多個渠道服務用戶的場景特別有吸引力。

實際用途

根據目前的社群回饋，Hermes Agent 跑得比較好的場景是：

重複性高的研究任務。例如每週追蹤特定主題的最新動態、定期整理競品資訊。Agent 會隨著時間累積關於這個主題的背景知識，後期的輸出品質明顯比初期好。

個人助理。透過 Telegram 或 WhatsApp 跑一個 Hermes Agent，讓它記住你的行程偏好、工作習慣、常用格式，隨著使用時間拉長，日常委派任務的溝通成本會愈來愈低。

模型訓練資料生成。Hermes 本身和 Nous Research 的 Atropos RL 框架整合，可以用來生成 fine-tuning 的訓練軌跡。這個用途是其他通用 Agent 框架比較少見的。

另外內建了 47 種工具，包含瀏覽器操作、網頁搜尋、排程（cron）、批量處理等，初始能力覆蓋範圍相當完整。

適合誰用

Hermes Agent 是 MIT 授權的開源專案，適合幾種情境：

想要一個能在多個訊息平台統一調度的個人 Agent
正在研究如何讓 Agent 具備長期記憶能力的工程師
在本機或私有環境部署 Agent、不想依賴特定雲端 API 的團隊
在做 LLM 研究、需要生成高品質訓練資料的研究者

如果你的使用情境是一次性任務或短期 demo，Hermes 的三層記憶體設計就顯得有點過重。但如果你的 Agent 需要長時間運行、累積知識、服務固定用戶——這個框架值得認真評估。

我在 Harness Engineering 那篇文章裡提到，Agent 系統要走向可靠上線，需要一層執行底盤負責可觀測性、circuit breaker 和狀態管理。Hermes Agent 的 Skill Memory 和持久狀態設計，本質上是把一部分 Harness 的職責內建進框架裡——這是個有意思的設計取捨。

這是「GenAI 產品實戰筆記」系列文章之一。

💬 延伸閱讀：

Hermes Agent：越用越聰明的開源 AI Agent 框架

大多數 Agent 框架的盲點

三層記憶體架構

底層模型：Hermes 4

模型無關 + 跨平台部署

實際用途

適合誰用

Harness Engineering：替你的 AI Agent 打造執行底盤

Andrej Karpathy 的「AI 精神病」與下一個十年：從手寫程式碼到指揮 Agent

大多數 Agent 框架的盲點

三層記憶體架構

底層模型：Hermes 4

模型無關 + 跨平台部署

實際用途

適合誰用

Harness Engineering：替你的 AI Agent 打造執行底盤

Andrej Karpathy 的「AI 精神病」與下一個十年：從手寫程式碼到指揮 Agent

訂閱最新分享