
AI Coding 已經起飛,但企業知識工作還在跑道上:Aaron Levie 談 Agent 落地的真正瓶頸
TL;DR
- AI coding 之所以爆發,是因為它有一堆其他知識工作不具備的條件:全文字媒介、開發者本身就是技術人、模型在程式碼上訓練最多、Lab 自己天天在用
- 企業要部署 Agent,最大的問題不是模型不夠聰明,是資料亂、權限複雜、context 不夠用
- Agent identity 是全新的問題:Agent 不是人,不能直接套用現有的帳號權限模型,因為它沒有法律責任,也不該有隱私權
- 人類是適應 Agent 的工作方式,不是 Agent 適應人類。整個經濟體都要經歷這個轉變,這需要好幾年
- 模型進步很快(Opus 4.6 在 Box 內部 eval 上有 15 分的跳躍),但資料本身是垃圾的話,再聰明的模型也救不了
Latent Space 是由 Swyx(shawn @swyx wang,smol.ai 創辦人)和 Alessio Fanelli(Decibel Partners 合夥人兼 CTO)主持的 AI 工程師 Podcast,基本上是 AI 應用層最硬核的對話節目之一。這集找來 Aaron Levie,Box 的共同創辦人兼 CEO,另外由 Chroma CEO Jeff Huber 擔任客座主持。Box 是一家做企業雲端內容管理的上市公司,幫財星 500 大企業管理檔案、權限、協作,目前約 67% 的財星 500 大是他們的客戶。Aaron Levie 大概是 Twitter 上對企業 AI 最有洞見的 CEO 之一,他的推文密度跟深度都很高。
AI Coding 爆發的八個條件,企業知識工作一個都沒有
這集最讓我有感的段落,是 Aaron 拆解為什麼 AI coding 已經達到逃逸速度,但其他知識工作還差得遠。
他列了一串條件:新工程師進來就能存取大部分 code base;程式碼是純文字輸入輸出;模型在這個資料集上訓練最深;Lab 自己的工程師天天在用自家產品所以回饋迴路超快;開發者本身就是技術人,裝最新工具毫無障礙;社群在線上互相分享 best practice。
然後你把這些條件拿去對比一個金融業的 banker:他只能存取一小部分資料、要跟一堆人開會才能拿到需要的東西、很多 context 來自 Zoom 通話和面對面會議根本沒被數位化、80% 的工作沒有文件化的規格書。
老實說,這個對比聽完之後我覺得很清醒。我們在 coding 的世界裡已經習慣 Agent 帶來的生產力跳躍,很容易以為這個速度會直接複製到所有產業。但實際上,coding 是條件最完美的場景,其他地方的摩擦力大到不可思議。
人類在適應 Agent,不是反過來
Aaron 講了一個我覺得非常精準的觀察:
我們改變了自己的工作方式來讓 Agent 有效運作。Agent 沒有適應我們的工作方式,是我們適應了 Agent 的工作方式。
想想你現在怎麼用 Claude Code 或 Cursor。你不寫程式了,你跟 Agent 對話,它去執行,你頂多 review。但為了讓這個流程順暢,你改變了多少習慣?你學會寫更好的 prompt,你把規格文件結構化,你調整了專案架構讓 Agent 更容易理解。
整個經濟體都要經歷同樣的演化。企業得重新設計 workflow、把資料整理成 Agent 能消化的格式、搞清楚怎麼給 Agent 正確的存取權限。這不是 Agent 丟進去就自動化你的人生那種故事。
OpenAI 在招 FDE(Field Deployment Engineer)進企業、Anthropic 駐點在 Goldman Sachs。連 Lab 自己都認為需要派人進去手把手幫客戶做 workflow 轉型,這個訊號夠明確了。
Agent Identity:一個全新的權限問題
這段我覺得是整集最值得深想的。
Aaron 用自己當例子:我在 Box 裡看不到其他員工的帳號內容,我對他們做的事沒有責任,他們有完整的隱私權。但 Agent 不一樣。創建 Agent 的人要為 Agent 的行為負責,Agent 不該有隱私權(因為它不能自主運作也沒有法律責任),你不能直接幫 Agent 開一個帳號然後當它是另一個員工。
然後問題更複雜:如果你的 Agent 去跟其他人協作呢?那個人跟 Agent 合作的內容,你作為 Agent 的創建者該不該看到?
傳統的 RBAC(Role-Based Access Control,基於角色的存取控制)在這個世界可能真的死了。Jeff Huber 甚至提到,人類不會把整份檔案都給你看,而是坐在你旁邊滑到某一頁讓你看那一段。Agent 的權限粒度需要細到這種程度。
這些問題 98% 的人覺得無聊透頂,但它們決定了 Agent 能不能真正在企業裡自主運作而不會天天洩漏資料。
Context Engineering 的殘酷數學
Aaron 算了一筆帳:一個知識工作者可能有一千萬份文件,乘以平均五頁,就是五千萬頁的資訊。然後你有多少 token 可以用?在不嚴重降低品質的前提下,大概六萬個 token。
五千萬頁 vs 幾百頁的 token window。這個比例差距是荒謬的。
所以搜尋系統、ranking、資料庫這些底層基礎設施變得極度關鍵。模型確實在進步,Opus 4.6 已經能在搜尋結果裡「聞到」哪些文件不太對勁,會自己回去重新查,但如果你的資料本身就是一片廢墟,再聰明的模型也無能為力。
(Aaron 的原話:if a really smart human could not do that task in five or 10 minutes, your agent is not going to be able to do it any better.)
Jeff Huber 也補充了一個很有趣的發現:Agent 不擅長「忘記」。如果它在 context 裡犯了一個錯,即使它自己在 trace 裡標註了「這大概不是好主意」,只要那個錯誤還在 context window 裡,它就會重複犯。因為對模型來說,那變成了 few-shot example。Groundhog Day。
2025 是 Coding Agent,2026 是 Knowledge Work
Aaron 很明確地說:2025 的故事是 coding agent 的崛起,2026 的故事是知識工作。Open Claw、Claude Work 這些只是開始。
但他也很務實地潑了冷水:這會是一個多年的 march,不是一個季度就能搞定的事。早期投入的團隊會看到複利效應,但大部分公司要真正部署到位,還需要很長的時間。
我自己的判斷是,這裡面最大的機會可能不在模型本身,而在中間層。幫企業把資料整理好、把權限設計好、把 workflow 重新架構的那些公司和服務。Aaron 自己也說,這是一個全新的 professional services 和 consulting 機會。
說白了,Agent 時代的贏家,搞不好不是 AI 最強的那一個,而是最會幫企業「打掃房間」的那一個。
後續我會持續追蹤 enterprise agent 這條線的發展,這類內容都會更新在 wilsonhuang.xyz,有興趣的話可以訂閱追蹤。
推薦閱讀
喜歡這篇文章嗎?
訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。
💌 隨時可以取消訂閱,不會收到垃圾郵件


