「模型戰爭」其實沒人關心了:Practical AI 拆解 Meta 放棄 Llama 之後的開源閉源新平衡

「模型戰爭」其實沒人關心了:Practical AI 拆解 Meta 放棄 Llama 之後的開源閉源新平衡

發布於
·13 分鐘閱讀
AIAI Agent開源產業觀察投資創業SaaSPodcast美股商業

TL;DR

  • Meta 放棄 Llama 開源路線、轉向閉源的 MuseSpark,西方開源陣營在 frontier model 上等於少了一個門面
  • 中國模型(Kimi、Qwen 3.5 那類)已經在開源領域明顯領先,但對美國國防和企業客戶反而是個政治難題
  • benchmark 上的差距還在,但對大多數實務應用根本不重要,模型已經變成可替換的 commodity
  • 真正會被市場記住的,不是誰家模型贏了 benchmark,而是誰把模型包進有用的 agentic harness 裡
  • 把整間公司押在某家 closed model 的 API 上,下一次 feature release(像 Claude Design 那樣)就會把你吃掉
  • agent 數量從個位數爆炸到上千個之後,治理、監控、agent-to-agent 通訊這些「Datadog 等級」的問題才是真正的高價值賽道

Podcast 背景

這集在 2026 年 5 月 7 日上線的 Practical AI 是 Changelog Media 出品的固定週更節目,主持風格走實務派,少炒作多拆解。兩位主持人剛好是 AI 產業裡兩種不同的視角:Daniel Whitenack 是 Prediction Guard 創辦人兼 CEO,這家公司專門做企業端的 LLM 安全和私有化部署;Chris Benson 則是 Lockheed Martin 的 Principal AI and Autonomy Research Engineer,整天在處理國防、情報、國安級的 AI 應用。

這集是兩人沒邀來賓的「Fully Connected」對談,從 physical AI 聊到 Meta 放棄 Llama,再到模型 commoditization 和 agent harness 才是真正戰場。對於想搞清楚 2026 年 AI 產業權力轉移的人來說,這集是少數從技術人視角看市場的內容。

Physical AI 已經不科幻了,是日常

Chris 開場分享的觀察我滿有共鳴的:兩年前在餐廳看到送餐機器人還會覺得新奇,現在你走進 Walmart、Costco 看到無人機送貨、貨架機器人在地上跑,根本不會抬頭。

他在 Lockheed Martin 看到的是國防情報側的 physical AI 應用,但他說這只是冰山一角。零售、製造、行銷,每一個既有產業都在長出自己的 physical AI 子產業。

關鍵是這個革命不是只有 AI 在動,背後還有一場大家較少談的 microelectronics 革命在同時發生。GPU、CPU、NPU、TPU 的界線越來越模糊,能在低功耗環境跑特化小模型的硬體越來越便宜。

Chris 講了一句我覺得很實在的:「現在你只要花幾百美金買幾個零件、下載一個模型、自己 tinker 一下,就有可能做出別人沒做過的東西。」這個門檻的下降速度,跟當年 IoT 開始爆發的邏輯很像。

Meta 放棄 Llama 是個訊號

接下來這段是這集最有訊號量的部分。

Yann LeCun 幾個月前離開 Meta,Llama 的開源路線在西方陣營裡差不多就此結束。Meta 接下來主推的是叫 MuseSpark 的閉源系列,Llama 已經在 frontier 賽道上越掉越遠。

主持人說的那段背景滿關鍵:當年 LeCun 願意留在 Meta 十年,條件之一就是模型必須開源。這個約束一旦消失,整個方向就變了。

這件事的麻煩之處在於:

  1. 西方 AI 陣營少了一個願意把 frontier 等級模型開源的大公司
  2. 開源 frontier model 的領導權,現在很明確地落在中國(Kimi、Qwen 3.5 那類)
  3. 但對美國國防、情報、政府標案來說,「用中國開源模型做產品然後賣給美國政府」基本上是不可能的劇本

對在做 enterprise AI 的人來說,這個 gap 是個真實的商業問題,不是哲學辯論。Chris 自己就在國防業,他直接說這個 gap 怎麼補沒有答案。

Benchmark 那幾趴差距,誰在乎?

Daniel 丟了一個有點挑釁的問題:「誰真的在乎 benchmark?這跟真實世界有什麼關係?」

我自己看 podcast 看到這邊有點想拍手。MMLU、SWE-bench、各種 reasoning arena,每次新模型出來大家都在比那幾個百分點,但對絕大多數實務應用來說,差幾趴的 benchmark 根本不影響產品好不好用。

Chris 補了一個很重要的角度:對 physical AI 那一票場景來說,根本不會用 frontier model。可穿戴裝置、邊緣運算、低功耗、不穩定通訊環境,這些場景需要的是針對特定任務優化的小模型。frontier model 跑得贏 benchmark 跟你產品好不好用完全是兩回事。

這個結論跟我之前在 用過 Claude Sonnet 4.5 的龍蝦 OpenClaw 再回頭看便宜模型 寫的觀察吻合:在 agent harness 裡面,模型品質會直接被你浪費的時間倒算回來,便宜模型省的那點錢根本不夠補。

把公司押在 Closed API 上的下場

這集講到最讓人冷汗的是 Daniel 提到的:很多新創把整間公司押在某家 closed model 的 API 能力上,結果模型供應商一個 feature release 就把你的產品吃掉。

他直接點名 Claude Design:Anthropic 兩週前才推出,前面一票做 design generation 的新創就被秒殺。OpenAI 的 image API 升級也是一樣的劇本。

這個風險我之前在 Cursor 600 億成交、Anthropic 衝一兆、Claude Design 開始啃 Figma 有寫過。Claude Design 不只是吃掉新創,連 Figma 這種估值幾百億的 incumbent 都得認真防守。

說白了,建立在「另一家公司的 API 上,而且那家公司有動機進入你的賽道」就是個很危險的位置。閉源模型的方便性是真的,但它的方便性同時也是別人的進場票。

模型已經是 commodity 了

Daniel 的結論滿有畫面感:模型現在跟玉米、黃豆一樣,是 commodity。

他舉了個比喻:你在餐廳吃到一道豆腐料理,會在意它用的是哪個品牌的黃豆嗎?不會。你在乎的是料理本身怎麼做、整道菜的味道怎麼樣。模型雖然是必要的零件,但只是整個產品系統裡的一小塊。

這跟咒術迴戰裡的領域展開很像:每家公司在自己定義的「料理規則」裡是無敵的,但出了那個範圍,模型本身的差異化已經沒那麼重要。

這個觀點延伸到 Anthropic 那個傳說中的 Mythos 模型也是一樣。資安圈很多人擔心 Mythos 一旦開放會把所有漏洞都掃出來,但 Daniel 的反問很到位:就算 Mythos 從來不釋出,現有的 AI 加 agentic harness 也已經足夠改變整個資安產業的玩法了。

真正的高價值賽道:Agent Harness

這集最有 takeaway 的一段是 Daniel 用 microservices 比喻 agent 生態。

回想一下 microservices 那十幾年的歷史:四五個還能管理,到一百個就很痛,到上千個就完全不可能靠人工管。然後 Datadog、Splunk、各種 observability 工具就變成不可或缺的、極端 sticky 的產品。

agent 世界正要走同一條路。現在很多人才剛做出第一個 agent,可能是個 LLM 加 embedding 加 MCP server 加幾個 API call 加一段 workflow code。看起來很酷。

但你要想像這個 agent 從一個變成十個、變成一百個、變成一千個之後會發生什麼事:

  1. 怎麼管理上百台 MCP server
  2. 怎麼處理 agent-to-agent 通訊
  3. 怎麼做 goal tracking
  4. 怎麼做 governance、policy enforcement
  5. 怎麼做監控和 root cause analysis

這些就是「agent 時代的 Datadog」會出現的位置。模型在這個系統裡確實有影響力,但它的角色更像軟體專案裡的某個 dependency,可以被 swap out,重要但不是核心。

這個論點跟 Aaron Levie 在 你沒辦法 Vibe Code 出一個 SAP 那集講的方向是同一條:企業軟體的真正價值不是模型,是 agent 底層的權限、資料、流程整合。

開源 vs 閉源什麼時候還重要?

這集沒有完全否定開源 vs 閉源的差異,Chris 整理出幾個明確的場景。

開源贏的場景:大規模高頻次工作負載(成本壓力大)、資料主權要求高的金融醫療政府、air-gap 環境的國防應用、延遲敏感場景、客製化和微調需求高的產品。

閉源贏的場景:不需要嚴格 infra 控制、需要 SLA 和高可用性的 production 場景、想用最頂的能力但不想自己維運、整合度高開箱即用的 productivity 工具。

兩邊都有自己的位置,要選對賽道,不是盲信哪一邊永遠贏。

我的判斷

說到底,2026 年再花時間爭論「開源會不會贏過閉源」已經是個錯題了。對的問題是:你的業務需要的是什麼樣的 agent harness?

Daniel 講的這句話我同意:把焦點放在你的業務問題、放在 agent harness 怎麼解決你公司的具體痛點,而不是追那些 model release 的 hype。

模型會繼續迭代,benchmark 會繼續被刷新,閉源會偶爾投擲一些核彈級 feature 把某條新創賽道整鍋端走。這些事情都不會停。但只要你建立的產品真正在解一個有 novelty 的問題、有自己的 agent 編排邏輯、有資料和流程的整合深度,模型就只是其中一個可替換的 dependency。

對台灣的開發者和創業者來說,這集其實提供了一個還不錯的視角:我們不需要去拚 frontier model 訓練(那條路要燒太多錢),但 agent harness、行業特化、本地化 workflow 整合這條路,門檻比想像中低。共勉之。

如果想看更多類似的產業觀察,wilsonhuang.xyz 都會持續更新,歡迎訂閱追蹤。

Sources:

推薦閱讀

喜歡這篇文章嗎?

訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。

💌 隨時可以取消訂閱,不會收到垃圾郵件