「模型戰爭」其實沒人關心了：Practical AI 拆解 Meta 放棄 Llama 之後的開源閉源新平衡

TL;DR

Meta 放棄 Llama 開源路線、轉向閉源的 MuseSpark，西方開源陣營在 frontier model 上等於少了一個門面
中國模型（Kimi、Qwen 3.5 那類）已經在開源領域明顯領先，但對美國國防和企業客戶反而是個政治難題
benchmark 上的差距還在，但對大多數實務應用根本不重要，模型已經變成可替換的 commodity
真正會被市場記住的，不是誰家模型贏了 benchmark，而是誰把模型包進有用的 agentic harness 裡
把整間公司押在某家 closed model 的 API 上，下一次 feature release（像 Claude Design 那樣）就會把你吃掉
agent 數量從個位數爆炸到上千個之後，治理、監控、agent-to-agent 通訊這些「Datadog 等級」的問題才是真正的高價值賽道

這集在 2026 年 5 月 7 日上線的 Practical AI 是 Changelog Media 出品的固定週更節目，主持風格走實務派，少炒作多拆解。兩位主持人剛好是 AI 產業裡兩種不同的視角：Daniel Whitenack 是 Prediction Guard 創辦人兼 CEO，這家公司專門做企業端的 LLM 安全和私有化部署；Chris Benson 則是 Lockheed Martin 的 Principal AI and Autonomy Research Engineer，整天在處理國防、情報、國安級的 AI 應用。

這集是兩人沒邀來賓的「Fully Connected」對談，從 physical AI 聊到 Meta 放棄 Llama，再到模型 commoditization 和 agent harness 才是真正戰場。對於想搞清楚 2026 年 AI 產業權力轉移的人來說，這集是少數從技術人視角看市場的內容。

Physical AI 已經不科幻了，是日常

Chris 開場分享的觀察我滿有共鳴的：兩年前在餐廳看到送餐機器人還會覺得新奇，現在你走進 Walmart、Costco 看到無人機送貨、貨架機器人在地上跑，根本不會抬頭。

他在 Lockheed Martin 看到的是國防情報側的 physical AI 應用，但他說這只是冰山一角。零售、製造、行銷，每一個既有產業都在長出自己的 physical AI 子產業。

關鍵是這個革命不是只有 AI 在動，背後還有一場大家較少談的 microelectronics 革命在同時發生。GPU、CPU、NPU、TPU 的界線越來越模糊，能在低功耗環境跑特化小模型的硬體越來越便宜。

Chris 講了一句我覺得很實在的：「現在你只要花幾百美金買幾個零件、下載一個模型、自己 tinker 一下，就有可能做出別人沒做過的東西。」這個門檻的下降速度，跟當年 IoT 開始爆發的邏輯很像。

Meta 放棄 Llama 是個訊號

接下來這段是這集最有訊號量的部分。

Yann LeCun 幾個月前離開 Meta，Llama 的開源路線在西方陣營裡差不多就此結束。Meta 接下來主推的是叫 MuseSpark 的閉源系列，Llama 已經在 frontier 賽道上越掉越遠。

主持人說的那段背景滿關鍵：當年 LeCun 願意留在 Meta 十年，條件之一就是模型必須開源。這個約束一旦消失，整個方向就變了。

這件事的麻煩之處在於：

西方 AI 陣營少了一個願意把 frontier 等級模型開源的大公司
開源 frontier model 的領導權，現在很明確地落在中國（Kimi、Qwen 3.5 那類）
但對美國國防、情報、政府標案來說，「用中國開源模型做產品然後賣給美國政府」基本上是不可能的劇本

對在做 enterprise AI 的人來說，這個 gap 是個真實的商業問題，不是哲學辯論。Chris 自己就在國防業，他直接說這個 gap 怎麼補沒有答案。

Benchmark 那幾趴差距，誰在乎？

Daniel 丟了一個有點挑釁的問題：「誰真的在乎 benchmark？這跟真實世界有什麼關係？」

我自己看 podcast 看到這邊有點想拍手。MMLU、SWE-bench、各種 reasoning arena，每次新模型出來大家都在比那幾個百分點，但對絕大多數實務應用來說，差幾趴的 benchmark 根本不影響產品好不好用。

Chris 補了一個很重要的角度：對 physical AI 那一票場景來說，根本不會用 frontier model。可穿戴裝置、邊緣運算、低功耗、不穩定通訊環境，這些場景需要的是針對特定任務優化的小模型。frontier model 跑得贏 benchmark 跟你產品好不好用完全是兩回事。

這個結論跟我之前在用過 Claude Sonnet 4.5 的龍蝦 OpenClaw 再回頭看便宜模型寫的觀察吻合：在 agent harness 裡面，模型品質會直接被你浪費的時間倒算回來，便宜模型省的那點錢根本不夠補。

把公司押在 Closed API 上的下場

這集講到最讓人冷汗的是 Daniel 提到的：很多新創把整間公司押在某家 closed model 的 API 能力上，結果模型供應商一個 feature release 就把你的產品吃掉。

他直接點名 Claude Design：Anthropic 兩週前才推出，前面一票做 design generation 的新創就被秒殺。OpenAI 的 image API 升級也是一樣的劇本。

這個風險我之前在 Cursor 600 億成交、Anthropic 衝一兆、Claude Design 開始啃 Figma 有寫過。Claude Design 不只是吃掉新創，連 Figma 這種估值幾百億的 incumbent 都得認真防守。

說白了，建立在「另一家公司的 API 上，而且那家公司有動機進入你的賽道」就是個很危險的位置。閉源模型的方便性是真的，但它的方便性同時也是別人的進場票。

模型已經是 commodity 了

Daniel 的結論滿有畫面感：模型現在跟玉米、黃豆一樣，是 commodity。

他舉了個比喻：你在餐廳吃到一道豆腐料理，會在意它用的是哪個品牌的黃豆嗎？不會。你在乎的是料理本身怎麼做、整道菜的味道怎麼樣。模型雖然是必要的零件，但只是整個產品系統裡的一小塊。

這跟咒術迴戰裡的領域展開很像：每家公司在自己定義的「料理規則」裡是無敵的，但出了那個範圍，模型本身的差異化已經沒那麼重要。

這個觀點延伸到 Anthropic 那個傳說中的 Mythos 模型也是一樣。資安圈很多人擔心 Mythos 一旦開放會把所有漏洞都掃出來，但 Daniel 的反問很到位：就算 Mythos 從來不釋出，現有的 AI 加 agentic harness 也已經足夠改變整個資安產業的玩法了。

真正的高價值賽道：Agent Harness

這集最有 takeaway 的一段是 Daniel 用 microservices 比喻 agent 生態。

回想一下 microservices 那十幾年的歷史：四五個還能管理，到一百個就很痛，到上千個就完全不可能靠人工管。然後 Datadog、Splunk、各種 observability 工具就變成不可或缺的、極端 sticky 的產品。

agent 世界正要走同一條路。現在很多人才剛做出第一個 agent，可能是個 LLM 加 embedding 加 MCP server 加幾個 API call 加一段 workflow code。看起來很酷。

但你要想像這個 agent 從一個變成十個、變成一百個、變成一千個之後會發生什麼事：

怎麼管理上百台 MCP server
怎麼處理 agent-to-agent 通訊
怎麼做 goal tracking
怎麼做 governance、policy enforcement
怎麼做監控和 root cause analysis

這些就是「agent 時代的 Datadog」會出現的位置。模型在這個系統裡確實有影響力，但它的角色更像軟體專案裡的某個 dependency，可以被 swap out，重要但不是核心。

這個論點跟 Aaron Levie 在你沒辦法 Vibe Code 出一個 SAP 那集講的方向是同一條：企業軟體的真正價值不是模型，是 agent 底層的權限、資料、流程整合。

開源 vs 閉源什麼時候還重要？

這集沒有完全否定開源 vs 閉源的差異，Chris 整理出幾個明確的場景。

開源贏的場景：大規模高頻次工作負載（成本壓力大）、資料主權要求高的金融醫療政府、air-gap 環境的國防應用、延遲敏感場景、客製化和微調需求高的產品。

閉源贏的場景：不需要嚴格 infra 控制、需要 SLA 和高可用性的 production 場景、想用最頂的能力但不想自己維運、整合度高開箱即用的 productivity 工具。

兩邊都有自己的位置，要選對賽道，不是盲信哪一邊永遠贏。

我的判斷

說到底，2026 年再花時間爭論「開源會不會贏過閉源」已經是個錯題了。對的問題是：你的業務需要的是什麼樣的 agent harness？

Daniel 講的這句話我同意：把焦點放在你的業務問題、放在 agent harness 怎麼解決你公司的具體痛點，而不是追那些 model release 的 hype。

模型會繼續迭代，benchmark 會繼續被刷新，閉源會偶爾投擲一些核彈級 feature 把某條新創賽道整鍋端走。這些事情都不會停。但只要你建立的產品真正在解一個有 novelty 的問題、有自己的 agent 編排邏輯、有資料和流程的整合深度，模型就只是其中一個可替換的 dependency。

對台灣的開發者和創業者來說，這集其實提供了一個還不錯的視角：我們不需要去拚 frontier model 訓練（那條路要燒太多錢），但 agent harness、行業特化、本地化 workflow 整合這條路，門檻比想像中低。共勉之。

如果想看更多類似的產業觀察，wilsonhuang.xyz 都會持續更新，歡迎訂閱追蹤。

Sources:

「模型戰爭」其實沒人關心了：Practical AI 拆解 Meta 放棄 Llama 之後的開源閉源新平衡

TL;DR

Podcast 背景

Physical AI 已經不科幻了，是日常

Meta 放棄 Llama 是個訊號

Benchmark 那幾趴差距，誰在乎？

把公司押在 Closed API 上的下場

模型已經是 commodity 了

真正的高價值賽道：Agent Harness

開源 vs 閉源什麼時候還重要？

我的判斷

推薦閱讀

Kyle Corbitt 拆解 RL 微調：為什麼 SFT 太暴力、GRPO 為什麼會 work、那個讓我笑出來的 Hacker News 故事

一個 string theorist 用五分鐘拿到 Sequoia 的支票，現在他在告訴你 token 該怎麼花

四十年寫四個程式語言，Anders Hejlsberg 在 The Pragmatic Engineer 上講的設計筆記

喜歡這篇文章嗎？