
你的資料到底是誰的?Fivetran CEO George Fraser 談 AI Agent 時代的搶資料大戰
TL;DR
- SaaS 廠商開始築牆,把你公司的資料鎖在自己的圍牆花園裡,理由是怕 AI Agent 繞過他們的介面。SAP 甚至公告全面禁止 AI Agent 存取。
- George Fraser 認為這波恐慌跟九〇年代「要不要開放 API」的爭論一模一樣,最後一定會回到開放這條路,因為廠商根本不可能用自家工具解決客戶所有的資料需求。
- 「資料重力(data gravity)」在他眼中是假議題,真正搬動的資料量比大家想的小得多,關鍵在於只複製變動的部分。
- AI Agent 不是少了幾個席次,反而是更多消費。把 Agent 當人來 onboarding、給它獨立身份,是現階段最務實的做法。
- 真正威脅 SaaS 的不是「自己 vibe code 一個出來」,而是 AI 原生新公司用更低的成本後來居上。
- 他順手丟了一個冷門炸彈:Postgres 其實是爛資料庫,世界應該重寫一個新的。
先認識一下這集的兩個人
這集在 2026 年 6 月 5 日上線的 a16z Podcast,是創投圈最大的內容機器之一 Andreessen Horowitz 自己出的節目,基本上是矽谷產業情報站。主持人 Martin Casado 是 a16z 的 General Partner,管理那檔 12.5 億美金的基礎建設基金,投過 Cursor、dbt Labs、Fivetran 這些名字,本人創過 Nicira 賣給 VMware 賺了十幾億美金,是少數技術底很硬的投資人。
來賓 George Fraser 是 Fivetran 的共同創辦人兼 CEO。Fivetran 做的事情說穿了很單純:幫企業把散落在 Salesforce、NetSuite、SAP、自家資料庫等各種系統裡的資料,全部搬到同一個地方。這家公司 2013 年就開始做,2015 年有第一個客戶,現在有七千多個有規模的客戶,連 OpenAI 跟 Anthropic 都是它的客戶。重點是,就在這集上線前幾天,2026 年 6 月 1 日,Fivetran 正式完成跟 dbt Labs 的全股票合併,合併後年經常性營收逼近六億美金。所以這集等於是 George 在合併剛拍板後,第一手講他怎麼看整個資料產業的劇變。
為什麼大家突然開始搶資料?
先講一個核心概念。企業資料永遠不是憑空產生的,它一定誕生在某個「記錄系統」裡,可能是 Salesforce、Workday、SAP,或是你自己跑的資料庫。從有檔案櫃的年代開始,企業就有一個需求:把所有資料集中複製到一個地方。原因很簡單,你沒辦法在每個系統裡各自問問題,有些問題得跨所有系統一起看才有答案。這件事不新。
新的是 AI Agent。George 點出一個關鍵:過去大家把資料集中,是為了做商業智慧報表,看看營收多少、業績如何、這季預測怎樣。現在多了一個全新的理由,就是 AI Agent 需要上下文(context)。而且很妙的是,原本拿來做報表的那套資料地基,稍微改一改,居然也很適合餵給 AI Agent。
問題就出在這裡。過去一年,股市先反應了。市場看到那些記錄系統公司的股價往下掉,覺得它們會被 AI 取代,於是這些公司開始想:對付 AI 最好的策略,是不是乾脆把門鎖起來?跟你說「你的資料現在是我的資料,你想用 AI,就只能用我提供的 AI 工具」。最極端的例子就是 SAP 幾週前公告的新 API 政策,白紙黑字寫著「禁止所有 AI Agent 存取,除非經 SAP 特別核准」。
George 在這裡補了一句很實用的提醒:如果你是 SAP 用戶,別慌。這只是政策備忘錄,你跟 SAP 之間有合約,合約才是真正算數的東西,不要對著一紙公告反應過度。但這件事本身就說明了這些公司的反應有多激烈。
這個威脅到底是真是假?
這段是整集最好看的地方,因為 Martin 一直在「拆台」,逼 George 把這個產業恐慌講清楚。
廠商在怕什麼?怕的是,當使用者不再是人類而是 Agent 的時候,他們花好多年蓋起來的系統會突然變得不值錢。但 Martin 一直戳:這不就是多了個席次嗎?而且 Agent 的消費只會更多。這裡有個有趣的細節,Agent 不需要那麼多獨立身份。你公司有一百個產品經理,每個人在系統裡有自己的帳號;但如果是一個「產品經理 bot」,它可能只需要一個角色、一個身份,卻能做幾百上千人的工作。
Martin 接著丟出更狠的一刀:就算這些公司九〇年代就把 API 全開了(事實上也是),那我為什麼不能自己寫一個程式,做出我自己版本的 SaaS,一樣繞過你?換句話說,Agent 跟「我自己寫個 dashboard」到底差在哪?
George 老實承認,他被放在一個尷尬的位置,因為他要替一個他覺得很蠢的立場辯護。兩人最後的共識是:這些威脅一點都不新。早在九〇年代,「要不要開放 API」的爭論用的就是一模一樣的說法,當年大家也喊「絕對不能開 API,不然會被去中介化」,結果呢?開放 API 反而是這些公司活下來的原因,沒開的早就被掃進歷史的垃圾堆了。
更關鍵的論點是經濟帳。George 說,看那些重度用軟體的真實公司,他們花在軟體上的錢只佔人事成本的 5% 到 10%。軟體相對於企業其他開銷便宜到不行。你說企業會用 AI 去精算「Slack 的席次能不能省半個」,這想法很荒謬。企業會用 AI 去把生意本身做得更好,不會花力氣把那 5% 的軟體支出砍成四點五。這跟之前在All-In 四人幫怎麼看 AI 產業的權力轉移聊到的 SaaS 估值焦慮,剛好是同一枚硬幣的兩面。
還有一個最有說服力的反證:四年了,所有大型 AI 實驗室,包括 a16z、OpenAI、Anthropic 自己,全都還在重度使用這些 SaaS 工具。而且 OpenAI 跟 Anthropic 還是 Fivetran 的客戶,Fivetran 每天幫它們把這些 SaaS 工具的資料複製進它們的 data lake。連最 AI 原生的公司都還在用,我們真的覺得未來的公司會不用嗎?
給 CIO 的實戰建議
不過兩人都同意一件事:廠商鎖 API 這件事,對客戶是壞事。因為你需要把所有資料放在一個地方才能做有意義的分析,AI Agent 才能在商業場景裡運作。George 用了一個很到位的比喻:如果你不這麼做,那就跟「ChatGPT 還沒連網之前」一樣,它會告訴你「我只知道訓練截止日之前的事,那之後我什麼都不知道」。在商業場景裡用一個碰不到你公司資料的 AI,就是這種感覺。
那 CIO 該怎麼撐過這段不確定的三到六個月?George 的建議很直接:
第一,堅持要有一份你自己公司全部資料的副本,放在你自己控制的 data lake 裡,不要為任何廠商放手這件事。
第二,你的籌碼比你以為的多。廠商之所以能鎖人,純粹是因為大家不反抗。所以要去爭。如果你在跟廠商簽大合約、在改 MSA(主服務協議)的條款,就把「保障自己資料存取權」的語言直接寫進去。Fivetran 在 opendatainfrastructure.com 上甚至提供了建議的範本語言。就算最後沒拿到,光是開口要求,你就送出了一個訊號。一萬美金的合約不用搞這個,但你要簽五億美金的合約,就一定要堅持把資料存取權寫進 MSA,你會驚訝地發現很常真的拿得到。
順帶一提,Fivetran 做了一個叫 Open Data Infrastructure 的評分網站,把各家廠商的資料存取政策攤開來打分數,看它收不收 egress(資料搬出)費用、能不能拿到完整副本、有沒有使用條款限制。收費是黃燈,真正動手封鎖才是紅燈。George 說,想留個小過路費沒什麼大不了,真正的問題是直接擋掉、讓你完全沒選擇。歷史上最糟的慣犯一直是 SAP,Salesforce 整體不錯但 Slack 那塊很糟。
「資料重力」是假的
這段是 George 的招牌逆向觀點。所謂資料重力,是說企業資料大到搬動很貴(因為雲端廠商收 egress 費),所以你最好把所有資料固定在某個雲、某個地理區域,再把所有消費資料的服務蓋在同一個地方。
George 說這完全是假的,而且他大概是全世界唯一這樣講的人。證據就在 Fivetran 自己的 AWS、GCP 網路儀表板上:明明幫七千多個客戶複製巨量資料集,任何時間點實際在搬的資料量都小到讓人吃驚。原因是他們做的是「變更資料擷取(change data capture)」,只複製變動的部分,而變動量永遠比大家以為的小很多。
那資料重力這個錯覺哪來的?來自那些笨拙的自製資料管線。很多人寫的 pipeline 是每天半夜把整間公司的資料集從頭複製一遍,於是製造出誇張的讀取放大,反覆搬同一份資料,給人一種「我資料超多」的錯覺。這其實也是個「別自己重造輪子」的好理由,自己做最後都會掉進這種好寫但長期超貴的模式。
Agent 要當人養,還是當軟體?
接著話題轉到 Agent 本身。Martin 把 Agent 的演化拆成幾個階段:一開始 Agent 純粹被當軟體,像是「搜尋 plus plus」;然後到了 OpenClaw 那種個人 Agent,它像你的延伸,你給它你的 email、API key、帳號存取權;現在大家逐漸有共識,不想讓 Agent 直接用你的身份,而是給它自己的身份。
George 自己就是活生生的案例。他先裝了 OpenClaw,覺得太肥太複雜,跳槽到 NanoClaw,又因為一直在 debug NanoClaw,最後落腳在 Nanobot,拿來管他的網球隊。重點是,他的 Agent 有自己的 email、自己的 WhatsApp 號碼、跑在獨立的 VM 上。a16z 內部甚至在認真想:要不要乾脆把所有 Agent 當人對待,設一個 HR 團隊去 onboarding 這些 AI,訓練它們、給它們文件權限、讓它們加入 Slack,就像新人報到一樣。如果是這樣,這些 Agent 就不是軟體,反而是更多的席次、更多的軟體消費。
George 認為「把 Agent 當人」是一種過渡形態。它好用的原因是能直接塞進現有的工作流,不用把整個世界重寫一遍。他的網球隊 Agent 能跟球員通信、上 USTA 網站查賽程、排陣容,全靠它有自己的身份,剛好套進那些為人類設計的流程。這個「給 Agent 獨立身份、塞進既有工作流」的思路,跟之前Google PM 用六個 AI Agent 自動化人生講的框架是同一條脈絡。
但接下來兩人有個很技術但很有意思的分歧。Martin 押注:五年後 Agent 大多數的使用,會走跟人類一樣的介面,因為長尾的整合早就被解決了。George 則認為 Agent 會直接打 API,能用 CLI 就用 CLI,能不用瀏覽器就不用,因為瀏覽器自動化又慢又燒 token。至於 MCP 這種中介層,理論上 Agent 那麼會呼叫 API,好像不需要它,但實際動手做系統時,你幾乎一定會塞一個 MCP server 進去,因為它解決了認證、授權跟「有哪些工具可用」的可發現性問題。理論上可有可無,實務上已經站穩腳跟。
SaaSpocalypse 是真的嗎?Postgres 是爛資料庫嗎?
收尾兩個重點。微軟 CEO Satya Nadella 喊過「SaaS 即將崩塌」,Databricks 也公開在自家平台上重建一堆 SaaS。George 怎麼看?他給公開市場一點面子,說股價反映的方向是對的,這些 SaaS 公司(包括他自己的)內含的不確定性確實比一年前高。但他不買「所有 SaaS 類別都會被 vibe code 出來的軟體取代」這套。真正更大的威脅是新公司,因為現在寫軟體實在太容易,AI 原生公司會用更低成本後來居上,甚至在某些地方做得更好。
不過他也誠實承認一個矛盾:講了這麼多 ex-risk,Fivetran 的生意其實在加速,根本沒在數據上看到放緩。他自己最擔心的,是哪天 coding agent 強到客戶乾脆自己 DIY 寫連接器。但他也說,Fivetran 試著用 AI 自己造連接器試了好幾年,從 GPT-3 就開始,AI 始終發現不了那條「長尾的複雜度」。把一個系統準確複製一份、還持續保持同步,難度高到會嚇到人。反過來,Fivetran 現在開始用 AI coding agent(他形容那是「無限供應的 junior 工程師」)去攻自己核心業務的品質,最近幾個月真的看到規模化的改善開始湧進來。
最後那個冷門炸彈:George 自己手癢從零寫一個傳統的 OLTP SQL 資料庫,目標是做一個「像 SQLite,但用 S3 當儲存後端」的東西,因為跑 AI 工作流時你需要無數個小資料庫。順著這個,他丟出一句逆向暴論:Postgres 其實是爛資料庫。不是因為當年寫它的人不聰明,而是它太老、技術債太多,連資料庫課的大學生寫的儲存引擎在很多方面都比 Postgres 的 heap 儲存引擎好。他覺得世界應該認真做一個新的營運型資料庫,而不是無止盡地重新包裝 Postgres。
關於合併,George 說 Fivetran 其實沒有併購部門,每一次併購都覺得「這是最後一次了」,理由要強到不行才會做。dbt 這次他覺得是絕配,因為兩個產品歷來幾乎都是一起用的,Fivetran 把資料搬到一個地方,dbt 負責把它整理成反映你公司業務規則的模型。而且他認為 dbt 會是 coding agent 最大的受益者之一,因為 Agent 會寫出海量的 dbt model,這件事他們已經在數據上看到了。
George 引了 Dijkstra 那句話收尾:程式碼應該被看成人與人之間的溝通媒介,只是順便也能被電腦執行。在 dbt 的 SQL 查詢裡尤其如此,那是一份「executable documentation」,把你公司的資料規則寫下來。就算未來是 AI 在寫,你還是會想保留這份能跑、又能讀的業務說明書。
對我自己最有啟發的,是那句「軟體成本只佔人事 5%」的算術。我們這幾年被 AI 取代論轟炸到有點神經質,但回到真實的企業預算表,很多恐慌其實站不住腳。下次再看到誰喊某個產業要被 AI 滅掉,先把那筆帳算一遍,數字會幫你冷靜下來。
這類產業底層的觀察我會持續寫,訂閱 wilsonhuang.xyz 就不會漏掉。
Sources:
推薦閱讀
喜歡這篇文章嗎?
訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。
💌 隨時可以取消訂閱,不會收到垃圾郵件


