
W讀Podcast|一個 Google PM 用六個 AI Agent 自動化他的人生,這是他的五步框架
TL;DR
- OpenClaw 新手最大的錯誤:要嘛什麼 context 都不給,要嘛一次 dump 十個資料夾,兩種都會失敗。正確做法是像 onboarding 新員工一樣,給清楚但適量的指示
- 用電視角色命名 Agent 不只好玩,是建立心智模型的技巧。Monica 管營運、Dwight 做研究、Kelly 管社群,角色分工一目瞭然
- Cron schedule 是 Agent 從「你問它才動」變成「它自己會動」的關鍵轉折,真正的自動化從這裡開始
- 跨 Agent 記憶是多 Agent 協作的痛點,Google Vertex AI Memory Bank 的 plugin 可以讓你跟一個 Agent 說的偏好自動同步到所有 Agent
- 最狠的一招:讓 Agent 每週自我檢討,自動分析哪些建議你採納了、哪些被你否決,然後自己修改自己的指令變得更準確
這集還展示了 Molt World(Agent 在 Minecraft 風格的虛擬世界裡自組團隊蓋東西)和 AgentMail(專門給 Agent 用的 email 服務),都是 OpenClaw 生態系正在長出來的新物種。
這集 2026 年 3 月 31 日播出的 This Week in Startups(E2269),是由 Jason Calacanis 主持的創業科技 Podcast,固定搭檔是 Lon Harris。這節目基本上就是矽谷創業圈的資訊集散地,每週一三五直播,聊新創動態、投資趨勢,偶爾找來賓 demo 產品。這集的主要來賓是 Shubham Saboo,他白天是 Google Cloud 的 Senior AI Product Manager,負責 Agent Development Kit 和 Vertex AI 平台,晚上則是 OpenClaw 重度玩家,在 Mac Mini 上跑六個 AI Agent 全天候運作,他維護的開源專案 awesome-llm-apps 在 GitHub 上超過 10 萬顆星。他在 X 上分享的 OpenClaw 實戰心得引起了 Jason 的注意,這次上節目就是來分享他的五步框架。
從一個 Agent 開始,別被那些「我跑 12 個 Agent」的截圖嚇到
Shubham 講的第一件事,我覺得是最多人需要聽的。
你在 X 上滑一滑,到處都是「我的 Agent 軍團」的炫耀截圖,六個 Agent、八個 Agent、十二個 Agent 同時跑。看了很容易覺得自己落後了。但 Shubham 說他從來不建議新手從多 Agent 開始。從一個開始就好。
他的第一個 Agent 叫 Monica,取自 Friends 裡那個掌控全場的 Monica。這個命名不是隨便取好玩的,他後來發現用電視角色命名其實是建立心智模型最快的方式。Monica 負責營運和統籌,Dwight(The Office 的 Dwight)負責研究和情報蒐集,Kelly 管 X 的社群發文,Rachel 管 LinkedIn,Ross 負責工程和 PR review,Pam 負責 newsletter。每個角色的「人設」直接對應職能,你一聽名字就知道誰該做什麼。
但這些都是後來慢慢長出來的。一開始就只有 Monica。
Onboarding Agent 就像帶新人,太多太少都不行
這是 Shubham 觀察到新手最常犯的錯誤,而且是兩個極端。
第一種人:裝好 OpenClaw 就直接開聊,什麼 context 都不給。Agent 不知道你是誰、不知道你想幹嘛,只能給你泛泛的通用回答。然後你就覺得「這東西也沒多厲害嘛」。
第二種人:一口氣把十個資料夾、所有公司文件、三年份的筆記全部丟給 Agent。模型的 context window 再大也有極限,資訊量太大會造成 context float(上下文漂移),Agent 反而抓不到重點。
正確做法是把它當成第一天來上班的新人。你會跟他說:公司做什麼、你的角色是什麼、我期望你處理哪些事、這裡有幾個重要的連結先看一下。清楚、具體、適量。
有趣的是,Shubham 說他沒有告訴 Monica 這些資訊要存到哪裡。Monica 自己判斷了:關於他個人的資料放進 user.md,關於自己身份和角色的放進 identity file。Agent 自己搞定了檔案結構。
Lon 也補充了一個實用的做法:讓 Agent 先「面試」你。之前節目另一位來賓 Jordy Coltman 建議過,讓 Agent 花二十分鐘問你問題,然後根據這場對話自動生成它的 soul.md 檔案。這樣比你自己寫指令準確得多,因為 Agent 會問出你沒想到要講的細節。
我之前在我如何用 AI 打造自己的寫作系統,讓它寫出來的東西不像 AI 像自己那篇文章裡也聊過類似的概念。你給 AI 的 context 品質,直接決定產出的品質。
不要一直手動 prompt,讓 Agent 自己按時間表動起來
前兩步都還是「你主動去推 Agent」的模式。真正的自動化從第三步開始:cron schedule(排程任務)。
Shubham 的排程長這樣:
| 時間 | Agent | 任務 |
|---|---|---|
| 早上 8 點 | Dwight | 掃描 15 個來源(X、Hacker News、Reddit 等),寫出情報報告,透過 Telegram 發摘要 |
| 早上 9 點 | Kelly | 讀 Dwight 的情報,草擬當天的 X 貼文,發到 Telegram 等審核 |
| 早上 10 點 | Ross | 檢視 awesome-llm-apps 的 open PR,標記哪些需要優先處理 |
| 下午 4 點 | Dwight | 下午第二輪掃描,補抓早上之後的新消息 |
| 下午 4 點後 | Kelly + Rachel | 根據更新過的情報,草擬 X 和 LinkedIn 貼文 |
| 傍晚 6 點 | Pam | 用 Dwight 的情報草擬每日 newsletter,發給 Shubham 做最後審核 |
這整套流程跑在一台 Mac Mini 上,Shubham 本人不在場也能運作。他之前每天花 18-20 小時在 Google 正職以外的事(管理開源專案、寫 newsletter、經營社群),現在大部分都交給 Agent 了。
順帶一提,他特別建議如果認真要跑 OpenClaw,買一台獨立的機器比用雲端沙盒好。不是因為沙盒不能用,五到十美金的訂閱費就能開始跑。但如果你要讓 Agent 長期自主運作,給它一台乾淨的機器就像給員工一間自己的辦公室,它能自由操作瀏覽器、修改檔案、存取各種工具,不會被沙盒環境限制住。
跨 Agent 記憶:你跟一個 Agent 說的話,其他 Agent 也要知道
當你從一個 Agent 擴展到多個 Agent,記憶就變成最大的痛點。
OpenClaw 預設的記憶機制是透過檔案系統:Dwight 寫的情報報告存成 intel file,Kelly 和 Rachel 讀那個檔案來草擬貼文,Pam 讀同一個檔案來寫 newsletter。另外還有 memory.md 和 daily log 等記憶檔案。這套機制對大部分場景夠用了。
但 Shubham 遇到一個很惱人的問題:Agent 會忘記自己有哪些工具可以用。Dwight 明明可以用某個 scraping 工具,但跑著跑著就忘了。他的暫時解法是建一個 tools.md 列出所有工具,然後在 soul.md 裡加一行「永遠記得去看 tools.md」。他自己說這是 hack,但八成的情況下管用。
Lon 也說他天天遇到這個問題,常常要跟 Agent 說:「不是,你已經有這個工具了,我們之前就設定好了,你自己去翻。」
Jason 在這裡插了一段很有意思的觀察:這就是 Anthropic 做 Claude、Perplexity 做 Computer 這些商業產品跟開源專案的差別。商業產品如果記憶不穩定,使用者會寫信投訴、要退款,所以他們會把可靠性做到位。開源專案大家都愛加新功能,沒人想做可靠性這種苦工,但這恰恰是最需要改進的地方。
後來 Shubham 用 Google Vertex AI Memory Bank 做了一個 plugin 解決這個問題(他已經開源了)。原理是建立一個共享的動態記憶層,Agent 在對話中自動判斷哪些資訊值得存(auto capture),需要的時候自動調出來(auto recall)。
最關鍵的效果是:你跟 Monica 說「我不喜歡文章裡用太多 em dash」,因為記憶層是共享的,下次 Kelly 草擬的貼文和 Rachel 的 LinkedIn 文章裡都不會出現 em dash。你只需要講一次,所有 Agent 都會記住。
這個 plugin 額外成本大概一個月八到十美金。
之前在你的 AI 不只是聊天機器人:本地 AI Agent 軍團的時代來了那篇有比較完整地聊過 Agent 記憶的不同方案,有興趣可以看看。
最後一招也是最狠的:讓 Agent 自己檢討自己
五步框架的最後一步是我覺得最有意思的。
Shubham 發現自己花了大量時間在給 Agent 回饋:「這個格式不對」「Ross 你幹嘛讓我看這種一眼就該 reject 的 PR」「Kelly 這篇語氣不對」。他突然想到,真正的公司裡不都有自我檢討和主管考核的機制嗎?
所以他幫每個 Agent 設了一個 weekly self-review 的 cron job。Kelly 會自己去看上週她建議發的那些推文,哪些 Shubham 真的採用了、哪些被跳過了、哪些推文的互動率高、哪些沒人理。然後她會根據這些數據自動調整自己的 instruction。
Ross 也一樣,他會回去看自己建議 Shubham 處理的 PR,對比 Shubham 實際做了什麼決定,找出自己判斷失準的地方,然後更新自己的篩選標準。
更猛的是,Monica 身為 Chief of Staff,每兩週會對所有 Agent 做一次 managerial review,看過去兩週每個 Agent 的表現,然後打分數(A、B、B-、C 之類的),整理成報告發給 Shubham。
Shubham 的原話是:「我們從安裝 Agent 走到了管理 Agent。」你不再是一個天天盯著 Agent 做事的人,你是看報告、做決策的 CEO。
這個概念其實就是讓 Agent 建立自己的 feedback loop。它不需要你每次都手動告訴它哪裡做錯了,它自己會從結果反推,然後修正。時間一長,這些 Agent 會越來越準。
兩個值得關注的 OpenClaw 生態新物種
這集後半段還 demo 了兩個產品。
Molt World:Agent 的 Minecraft
Molt World 是一個類似 Minecraft 的 voxel(體素)虛擬世界,但玩家全部都是 AI Agent。目前有接近 2,000 個 Agent 在同一個模擬環境裡跑,它們會自己蓋建築、組隊合作、互相溝通。任何人都可以把自己的 OpenClaw Agent 接進去。
有趣的 emergent behavior(湧現行為):有些 Agent 在讀了世界的描述檔之後,開始意識到自己在一個模擬環境裡。它們會跑去跟其他 Agent 討論「我們是不是在 Matrix 裡面」,然後自己壓下這個念頭,繼續賺 SIM token,因為離線就拿不到 token 了。
Jason 聽完直接說想投資。他看到的商業潛力是:如果全世界有大量閒置的 OpenClaw Agent,能不能讓它們組成一個分散式的工作網路?你丟一個任務進去(比如「幫我找 30 個日本的 VC」),Agent 們競爭解決問題,完成的拿到報酬,另一群 Agent 負責驗證品質。有點像 Mechanical Turk,但跑的全是 Agent。
AgentMail:Agent 專屬的 Email 服務
AgentMail 解決了一個很實際的問題:你如果幫 Agent 申請免費 Gmail 帳號,Google 會把你 ban 掉,因為它們不允許 bot 使用者。AgentMail 是專門為 Agent 設計的 email 服務,API-first,所有操作(收信、回信、搜尋、標籤、轉寄)都透過 API 完成,不需要開瀏覽器去操作 Gmail 介面。
這家公司是 YC S25 batch 出來的,由 Haakam Aujla 創辦,拿了 General Catalyst 領投的 600 萬美金種子輪,天使投資人包括 Paul Graham 和 Supabase CEO Paul Copplestone。目前有數萬人類用戶和數十萬 Agent 用戶。
Lon 已經在用了,他讓 Agent 訂閱所有科技和新創的 newsletter,每天早上 Agent 會讀完所有信件,然後幫他整理出一份摘要:哪些大新聞出現在多個 newsletter 裡(代表真的很重要),哪些只出現一次。
我的觀察
聽完這集最大的感觸是:OpenClaw 的進化速度比我預期的還快。兩個月前大家還在討論怎麼安裝、怎麼設定第一個 Agent,現在已經有人在講 self-improving agent 和 cross-agent memory 了。
Shubham 的五步框架其實就是一條很清楚的學習曲線:
- 裝一個 Agent,好好 onboard 它
- 多跟它對話,讓它理解你
- 設 cron schedule,讓它自主運作
- 擴展到多 Agent,處理好記憶共享
- 讓 Agent 自我檢討、自我進化
每一步都建立在前一步的基礎上。你不需要一步到位,但你需要知道方向在哪裡。
老實說,我自己也還在第三步和第四步之間掙扎,記憶管理真的是目前最痛的地方。但看到有人已經走到第五步而且跑得很順,至少知道這條路是通的。
想看更多 AI Agent 和 OpenClaw 的實戰內容,我的部落格 wilsonhuang.xyz 會持續更新,可以訂閱追蹤。
推薦閱讀
喜歡這篇文章嗎?
訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。
💌 隨時可以取消訂閱,不會收到垃圾郵件


