AI Coding 已經起飛，但企業知識工作還在跑道上：Aaron Levie 談 Agent 落地的真正瓶頸

TL;DR

AI coding 之所以爆發，是因為它有一堆其他知識工作不具備的條件：全文字媒介、開發者本身就是技術人、模型在程式碼上訓練最多、Lab 自己天天在用
企業要部署 Agent，最大的問題不是模型不夠聰明，是資料亂、權限複雜、context 不夠用
Agent identity 是全新的問題：Agent 不是人，不能直接套用現有的帳號權限模型，因為它沒有法律責任，也不該有隱私權
人類是適應 Agent 的工作方式，不是 Agent 適應人類。整個經濟體都要經歷這個轉變，這需要好幾年
模型進步很快（Opus 4.6 在 Box 內部 eval 上有 15 分的跳躍），但資料本身是垃圾的話，再聰明的模型也救不了

Latent Space 是由 Swyx（shawn @swyx wang，smol.ai 創辦人）和 Alessio Fanelli（Decibel Partners 合夥人兼 CTO）主持的 AI 工程師 Podcast，基本上是 AI 應用層最硬核的對話節目之一。這集找來 Aaron Levie，Box 的共同創辦人兼 CEO，另外由 Chroma CEO Jeff Huber 擔任客座主持。Box 是一家做企業雲端內容管理的上市公司，幫財星 500 大企業管理檔案、權限、協作，目前約 67% 的財星 500 大是他們的客戶。Aaron Levie 大概是 Twitter 上對企業 AI 最有洞見的 CEO 之一，他的推文密度跟深度都很高。

AI Coding 爆發的八個條件，企業知識工作一個都沒有

這集最讓我有感的段落，是 Aaron 拆解為什麼 AI coding 已經達到逃逸速度，但其他知識工作還差得遠。

他列了一串條件：新工程師進來就能存取大部分 code base；程式碼是純文字輸入輸出；模型在這個資料集上訓練最深；Lab 自己的工程師天天在用自家產品所以回饋迴路超快；開發者本身就是技術人，裝最新工具毫無障礙；社群在線上互相分享 best practice。

然後你把這些條件拿去對比一個金融業的 banker：他只能存取一小部分資料、要跟一堆人開會才能拿到需要的東西、很多 context 來自 Zoom 通話和面對面會議根本沒被數位化、80% 的工作沒有文件化的規格書。

老實說，這個對比聽完之後我覺得很清醒。我們在 coding 的世界裡已經習慣 Agent 帶來的生產力跳躍，很容易以為這個速度會直接複製到所有產業。但實際上，coding 是條件最完美的場景，其他地方的摩擦力大到不可思議。

人類在適應 Agent，不是反過來

Aaron 講了一個我覺得非常精準的觀察：

我們改變了自己的工作方式來讓 Agent 有效運作。Agent 沒有適應我們的工作方式，是我們適應了 Agent 的工作方式。

想想你現在怎麼用 Claude Code 或 Cursor。你不寫程式了，你跟 Agent 對話，它去執行，你頂多 review。但為了讓這個流程順暢，你改變了多少習慣？你學會寫更好的 prompt，你把規格文件結構化，你調整了專案架構讓 Agent 更容易理解。

整個經濟體都要經歷同樣的演化。企業得重新設計 workflow、把資料整理成 Agent 能消化的格式、搞清楚怎麼給 Agent 正確的存取權限。這不是 Agent 丟進去就自動化你的人生那種故事。

OpenAI 在招 FDE（Field Deployment Engineer）進企業、Anthropic 駐點在 Goldman Sachs。連 Lab 自己都認為需要派人進去手把手幫客戶做 workflow 轉型，這個訊號夠明確了。

Agent Identity：一個全新的權限問題

這段我覺得是整集最值得深想的。

Aaron 用自己當例子：我在 Box 裡看不到其他員工的帳號內容，我對他們做的事沒有責任，他們有完整的隱私權。但 Agent 不一樣。創建 Agent 的人要為 Agent 的行為負責，Agent 不該有隱私權（因為它不能自主運作也沒有法律責任），你不能直接幫 Agent 開一個帳號然後當它是另一個員工。

然後問題更複雜：如果你的 Agent 去跟其他人協作呢？那個人跟 Agent 合作的內容，你作為 Agent 的創建者該不該看到？

傳統的 RBAC（Role-Based Access Control，基於角色的存取控制）在這個世界可能真的死了。Jeff Huber 甚至提到，人類不會把整份檔案都給你看，而是坐在你旁邊滑到某一頁讓你看那一段。Agent 的權限粒度需要細到這種程度。

這些問題 98% 的人覺得無聊透頂，但它們決定了 Agent 能不能真正在企業裡自主運作而不會天天洩漏資料。

Context Engineering 的殘酷數學

Aaron 算了一筆帳：一個知識工作者可能有一千萬份文件，乘以平均五頁，就是五千萬頁的資訊。然後你有多少 token 可以用？在不嚴重降低品質的前提下，大概六萬個 token。

五千萬頁 vs 幾百頁的 token window。這個比例差距是荒謬的。

所以搜尋系統、ranking、資料庫這些底層基礎設施變得極度關鍵。模型確實在進步，Opus 4.6 已經能在搜尋結果裡「聞到」哪些文件不太對勁，會自己回去重新查，但如果你的資料本身就是一片廢墟，再聰明的模型也無能為力。

（Aaron 的原話：if a really smart human could not do that task in five or 10 minutes, your agent is not going to be able to do it any better.）

Jeff Huber 也補充了一個很有趣的發現：Agent 不擅長「忘記」。如果它在 context 裡犯了一個錯，即使它自己在 trace 裡標註了「這大概不是好主意」，只要那個錯誤還在 context window 裡，它就會重複犯。因為對模型來說，那變成了 few-shot example。Groundhog Day。