
Hermes Agent:Nous Research 的「越用越聰明」AI 賭注
TL;DR
- Nous Research 從 Discord 上的開源社群正式變成公司兩年了,最新作品 Hermes Agent 在 2026 年 2 月上線後幾週就累積 22,000 顆 GitHub star,到五月已經逼近 96,000 顆
- 開源 AI 在西方一度被 Meta Llama 撐著,但 Llama 4 燒掉幾億美金後已經沒人接棒,現在主要靠中國模型在跑;NVIDIA 跳出來承諾未來幾年砸 200 億美金支持西方開源,理由很現實,所有模型最後都跑在它家晶片上
- Hermes Agent 的差異點是「越用越聰明」:用一次學會的 skill,下次直接套用,30 到 45 分鐘破解一個訂位網站後,下次幾秒鐘搞定
- 用 Agent 的原則:把它當成「擁有無限耐心但沒什麼創意的同事」,描述結果跟驗收條件,不要逐步下指令
- 美感是 AI 最大的盲點,因為審美是人類獨有的「水中之魚」,跟生物演化綁在一起
節目跟來賓背景
這集在 2026 年 5 月 21 日播出的 Practical AI Podcast,由 Daniel Whitenack(Prediction Guard CEO)跟 Chris Benson(資深 AI 工程師)共同主持。節目由 Changelog Media 出品,定位是「把 AI 講得讓開發者、業界跟一般好奇的人都能聽懂」,跟那種狂喊 AGI 的節目氣質完全不同。
這集邀請 Nous Research 共同創辦人 Jeff Quesnelle 上節目。Nous Research 是 2022 年從 Discord 跟 Twitter 起家的開源 AI 集體,2023 年由 Jeff、Karan Malhotra、Teknium、Shivani Mitra 正式成立公司,目標是「不要讓 AI 這個世代級的技術被幾家封閉公司鎖死」。他們的 Hermes 系列模型在 fine-tune 圈子算是必裝品;最新作品 Hermes Agent 在 2026 年 2 月上線,MIT 授權、純開源,幾週內就衝到 22,000 顆 star。
開源 AI 的權力,正在悄悄轉手
Jeff 把開源 AI 過去三年的劇情線講得很清楚。
一開始是 Zuckerberg 個人意志撐著 Llama 一路開源,整個西方研究社群很多人是下載 Llama 起家的。但 Llama 4 投了三四億美金結果做出一個半成品的 paperweight,Meta 內部開始問:「我們花這個錢的商業邏輯到底在哪?」答案不太好聽,Llama 5 大概不會再來了。
同一時間 DeepSeek 從中國丟出一個近 SOTA 的開源模型,把賽局從美國內部金錢戰,直接推上地緣政治餐桌。中國公司發現「丟一個開源模型出來就能擠進產業頭部」這套打法在當地特別划算,所以一波又一波繼續來。我之前那篇Meta 放棄 Llama 之後的開源閉源新平衡就在拆這個結構性變化,這集 Jeff 補上了現場感。
真正讓他樂觀的是 NVIDIA。Jensen Huang 在最近的 GTC keynote 直接喊出未來幾年投 200 億美金訓練西方開源模型。Jeff 的觀察很到位:「你拉 sweater 的線去問,誰真的有商業誘因做開源模型?答案是 NVIDIA。因為所有東西最後都跑在它的晶片上。莊家是 NVIDIA,這把它可以玩。」
模型是大腦,Harness 是身體
聊到 Hermes Agent 的設計哲學,Jeff 丟出我覺得這集最受用的比喻。
模型是大腦,agent harness(讓 AI 能跟真實世界互動的執行框架)是身體。一個 IQ 150 的人坐在輪椅上,能影響世界的範圍就是有限。一個 IQ 95 但身體是運動員,反而能去做更多事。好 harness 配差模型,會贏好模型配差 harness。兩者是共生關係,但實際上去碰「真實世界」的,是 harness 而非模型。模型本身只會吐 token,沒有 harness 把那些 token 變成行動,AI 對人類的意義就接近零。
這個比喻順便回答了「Hermes Agent 跟 Claude Code、OpenClaw 的差別在哪」的問題。我之前寫過本地 AI Agent 軍團的時代,這集可以當作 Hermes 派系的官方說法來對照看。
真正的差異化:Skill 系統跟記憶系統
Jeff 講了一個很直觀的例子。團隊要去 offsite,他在飛機上叫 Hermes Agent 幫他訂一家 Las Vegas 的餐廳。網站上有一堆反爬蟲機制,agent 卡住了好幾次,最後居然自己摸到後端 API,花了 30 到 45 分鐘把這件事搞定。
重點在這裡:搞定之後,Hermes Agent 自己決定「這個東西以後可能還用得到」,把它存成一個叫做 Las Vegas restaurant booking 的 skill。隔天 Jeff 回來說「昨天那家不錯,幫我訂另一家」,agent 秒回,因為它已經知道怎麼做了。
這就是「越用越聰明」的具體意思。skill 是 agent 自己歸納出來的,工程師沒有手刻;memory 是分層的,越久遠的 session 越壓縮,但需要時可以調回來。再加上每次 GPT 或 Claude 升級,整個 Hermes Agent 的判斷力就跟著升一級。這個架構等於把模型升級的紅利長期外包給前沿模型廠,自己只負責把 skill 跟 memory 累積好。
內部 dogfooding:一個 debug 工具長成全公司的客服
Jeff 提到一個很妙的例子。Nous Research 內部有一個 Hermes Agent 透過 MCP 連到所有 backend(Vercel、資料庫、各家服務商),一開始只是工程師拿來 debug 用:「網站出現 500 了,幫我看一下發生什麼事」。
用了一個月之後,這個 agent 累積出一整套排查 skill。後來客服直接跟它對話:「這個客戶的帳號出什麼問題?」它能跑完整的根因分析、給出報告。重點是這些 skill 沒有人寫過程式,是工程師用的時候 agent 自己學會的,最後變成整間公司都能用的共享知識庫。
Hermes Agent 本身的程式碼,現在 99.99% 是 Hermes Agent 自己寫的。這也是 Jeff 對「人類還會剩下什麼角色」的部分回答:他自己寫程式寫了快三十年,過去半年才認輸承認模型寫得比他好。但他說這件事不該是失落,而是讓他「可以再當一次 early」。
怎麼把 Agent 當人用?想成「無限耐心、零創意的同事」
Chris 問了一個我覺得每個剛開始用 AI agent 的人都會撞到的問題:什麼任務該丟給 agent,什麼不要?
Jeff 的答案很簡單:把它想成有無限耐心、但創意極低的同事。要看完一萬行 log 並找出問題?人類辦得到,但沒人想做,這就是 agent 的甜蜜點。要 brainstorm 一個顛覆性產品方向?放過它。
第二個原則更實用:描述結果跟驗收條件,不要描述步驟。新手喜歡逐步控制 agent,「做這步、再做這步」,但模型 long-horizon planning 只會越來越強,你要做的是把目標跟「怎樣算完成」講清楚,剩下交給它。
這也呼應了他講的另一個觀察:AI 沒有審美。它不知道什麼叫「不要太 slop」、「段落長度不要太工整」,因為這些是人類的水中之魚,是我們從演化、共同經驗裡長出來的判斷。想要它寫出不像 AI 的文章,你得把那些「不必說的潛規則」全部攤開明說。不然它就會給你最平均值的答案,然後覺得自己交了一份漂亮答卷。
一個剛當爸爸五天的人在想什麼
節目最後問 Jeff「最近睡前在想什麼」,他講了一段意外觸動我的話。他五天前剛當爸爸,他在想的是十年、二十年後,那一代人如果從出生就活在「答案在電腦裡」的世界,會不會連 critical thinking 都長不出來。「每代人會把自己長大過程看到的當成正常。」
Nous Research 的內部口號叫 human-centric AI,他們相信 AI 應該讓你今天比昨天好、明天比今天好。但這需要使用者自己有自覺,不能把腦袋整包外包出去。我覺得這段話跟產品本身的設計哲學是一致的。Hermes Agent 不替你決定 skill 是什麼,而是觀察你怎麼做、再把方法存起來。它在放大你的判斷力,沒有要取代它的意思。
這集對我來說最大的收穫是那個 brain/body 比喻,跟 skill 系統自己長出來的設計哲學。如果你最近正在猶豫要不要從 chat 介面升級到本地 agent,這集很值得從頭聽一次。
想看更多 AI agent 跟開源生態的觀察,wilsonhuang.xyz 會持續更新這類內容,有興趣的可以訂閱追蹤。
推薦閱讀
喜歡這篇文章嗎?
訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。
💌 隨時可以取消訂閱,不會收到垃圾郵件


