
Descript 不是 slop machine:Laura Burkhauser 拆解 AI 創作工具的敵意分級
TL;DR
- Slop 跟內容好不好看無關,動機才是關鍵。Laura 對 slop 的定義是「為了演算法套利而大量生產的內容」,bad art 不是 slop,bad art 反而是創作者必經之路
- Descript 用戶對 AI 功能的接受度有明顯的敵意分級:narrow purpose 的工具(Studio Sound、Green Screen)人人愛,agentic co-editor 想要但嫌不夠好,generative video 直接被罵爆
- Build vs Buy 策略很清楚:Descript 自己訓 augmented recorded media 相關的模型(regenerate、jump cut smoothing),純生成模型一律向外採購
- AI 時代的定價陣痛期:點一次按鈕燒掉幾塊美金 credit 的體驗很差,Descript 的設計目標是讓不到百分之五的活躍用戶會碰到上限
- 對 AI 取代創作者這個命題,Laura 不買單。藝術會用意想不到的方式回應新技術,相機沒幹掉繪畫,generative AI 也不會幹掉所有人
這集 Cognitive Revolution Podcast 在 2026 年五月六日上線。Cognitive Revolution 由 Nathan Labenz 主持,是矽谷 AI 圈裡少數同時兼具技術深度跟產品 sense 的訪談節目,Nathan 自己就在做 AI 產品 Waymark,所以聊起來不是表面問答。受訪者是 Descript 新任 CEO Laura Burkhauser。Descript 大家應該都有印象,2017 年由 Andrew Mason(Groupon 創辦人)創辦,主打用編輯逐字稿的方式編影片,目前估值約五億五千萬美金、六百多萬名創作者在用、ARR 五千五百萬美金、年增七成五。Andrew 退到 executive chairman 位置,Laura 從 VP of Product 接班,是這個產品團隊裡看著 AI 浪潮一路走過來的人。
我自己是 Descript 重度用戶,也是他們 Underlord API 的 early adopter,這集聽起來特別有共鳴。
Slop 是什麼?答案不是你想的那樣
Laura 上任後寫了一封給用戶的信,第一句就是「Descript isn't a slop machine, and we don't want it to be」。Nathan 一上來就問她:所以 slop 到底是什麼?
她的定義很有意思:slop 跟內容爛不爛沒關係,看的是動機跟規模。
Slop 是一種內容套利。當你發現市場有個短暫的低效率,可以用極低成本灌爆系統,靠這些內容換到不錯的廣告分潤或訂閱,這就是 slop。兩個關鍵:動機是錢,而且 at scale。
這個拆解很乾淨。她特別強調,「不好看的內容」跟「slop」是兩件事,「我是 pro bad art」她說,每個創作者一開始都會做出讓自己回頭看會臉紅的東西,這是必經之路。她甚至直接 callout Nathan:你還記得自己最早放上網路的東西嗎?現在再看肯定想埋進地裡。
這個區分對我來說很重要。我在我如何用 AI 打造自己的寫作系統,讓它寫出來的東西不像 AI 像自己這篇也提過類似問題:AI 寫出來的東西能不能算你自己的?我的答案跟 Laura 一致,看的是動機跟你願不願意為作品負責,工具反而是其次。
她還補了一句很狠的:很多看起來像 slop 的東西其實只是「someone's bad idea」,someone's bad idea 還有機會走出自己的路,但 slop 本質是套利機器,演算法的縫一補它就死了。
為什麼現在 generative AI 內容品質還這麼差?兩個原因
Laura 講了兩個原因,每個都打到痛點:
第一,技術還沒到。 沒有人會自願選擇「五到十秒一段、生成完之後祈禱兩段之間聲音延續性夠好」這種工作流程。她說現在要做出像樣的 generative AI 內容,你必須超級投入這個媒介,整個過程都在跟工具搏鬥。需要生成五十次才能拿到一個堪用的 take 是常態。
第二,有 taste 的創作者不想公開承認自己在用。 現在 X 上看得到在玩這些工具的,多半是「還在學什麼叫好」的人。真正有品味的那群人覺得用這個工具丟臉,所以你看到的範例品質普遍偏低。
這兩點都很到位。我自己生過幾次 AI 圖、做過幾段 AI 影片,每次都覺得「為什麼老天爺要讓我做這個」的感覺很強。但在自己的創意團隊裡,比我會用這些工具的人做出來的東西就完全是另一個等級。Laura 點到一個關鍵字:vocabulary。會用這些工具的人有一個我沒有的詞彙表,他們知道怎麼描述構圖、光線、節奏,所以 prompt 能下得精準。沒有這個詞彙表的人就只能在霧裡走。
AI 功能的敵意分級:用戶其實沒那麼討厭 AI
這是這集最有產品 sense 的一段。Laura 上任後處理了一波調漲訂閱的負評,看到一個重複出現的回饋:「希望你們別再花時間做 AI 功能,回去把 core quality 做好」。
她的反應是:等等,你說的 core quality 是什麼?是上傳速度、播放流暢度,還是新功能?
挖下去之後她發現一個很重要的真相:用戶根本沒辦法分辨什麼是 AI 功能,他們只是對某些 AI 功能很反感。 Descript 從第一天就是 AI native,用逐字稿編影片本身就是 AI 想法,Studio Sound、Green Screen、Overdub 全都是 AI 模型,但用戶不覺得這些是「AI 功能」。
她整理出一個清楚的敵意分級:
| 功能類型 | 用戶反應 | 範例 |
|---|---|---|
| Narrow purpose 的 AI 特效 | 全部都愛,繼續做 | Studio Sound、Green Screen、Voice Cloning |
| Agentic co-editor | 又愛又恨,想要但抱怨不夠好 | Underlord |
| Generative video / image | 厭惡反感,連帶把整個 AI 都討厭起來 | Seedance、Veo、Nano Banana |
這個分級對任何在做 AI 產品的人都是金句。用戶真正討厭的是「behaving badly」的 AI,AI 本身他們其實不抗拒。 一個按鈕點下去結果可預測、品質穩定的功能,不管底層是什麼大家都愛。一個功能多但每次結果都不一樣的東西,怎麼推都會有人罵。
我自己在做寫作 pipeline 的時候也踩過類似的雷。一開始我用大模型自動產出全文,每次結果都不同,自己看了都不太滿意。後來改成把流程拆成 N 個小步驟,每一步都是 narrow purpose(提取重點、整理結構、套用風格、查核事實),整體輸出穩定多了。Laura 講的這個敵意分級,本質上講的是同一件事:確定性是 AI 產品的生命線。
Build vs Buy:Descript 在哪裡花錢自己訓模型
Laura 說 Descript 的策略是「先想好你要在哪個戰場贏」,再決定要不要自己訓模型。
她給了一個很清楚的 framing:Descript 想贏的是 augmented recorded media,先有錄好的內容、再用 AI 幫你修。例子:
- Regenerate:你錄完發現一段話不滿意,直接改逐字稿,AI 用你的聲音、嘴型重新生成那段,新版本還會 lip dub
- Jump cut smoothing:硬切的地方 AI 自動補成「你自然移動過去」的樣子
- Retake removal、filler word removal:刪掉口頭禪、重錄段落
這些功能對 Google、Anthropic、OpenAI 都不夠重要,他們不會花錢去解這些問題。但 Descript 有獨家數據:每天幾百萬名創作者在這個工具裡做的「結構化編輯動作」是其他人沒有的。所以這個戰場 Descript 自己訓模型有優勢。
純生成式那塊她直接放棄:「就算我花幾億美金去做生成模型,最後還是會輸給 Google,幹嘛把錢拿去燒?」這個態度滿務實的。我之前在Codex、Claude Code、Cursor:AI Coding Agent 的三座燈塔,誰會活到最後?那篇也分析過類似邏輯:應用層公司打底層基礎模型基本上都會輸,能贏的地方是垂直數據跟整合體驗。
Laura 的判斷標準也很簡單:一個任務(一)我有獨家數據嗎(二)成本可控嗎(三)大模型實驗室會不會某天突然 care 這件事?三個都對勾才自己做。
Vibes 還是評測的核心,這聽起來反直覺但她講得有道理
Nathan 問了一個產品團隊都會問的問題:模型那麼多,怎麼選用哪個進產品?
Laura 的回答誠實到讓人發笑:「滿大一部分是 vibes,我不騙你」。但她接著解釋為什麼這沒問題。
Descript 用 FAL 當第三方模型 provider,所以選擇池子先被框定。在池子裡面他們會看公開 leaderboard、跑內部 eval、然後 A/B test。但最關鍵的一件事:美感判斷沒辦法完全自動化。
她舉了 MidJourney CEO 的例子。為什麼 MidJourney 美感還是業界最好?因為「我把大拇指壓在天平上」(thumb on the scale)。Google 用某種民主式的自動評分,最後選出來的「最佳圖片」永遠是某個千篇一律的金髮美女。但 MidJourney 老闆自己有 taste,他會親自介入。
更有意思的是 Studio Sound 的故事。這個功能最早是一個大提琴手做的,他耳朵特別好,最早的 eval 流程就是他坐在那裡聽不同模型輸出,「這個比較好、這個比較好」這樣選。等他離開公司,Descript 才被迫寫一份「衡量背景噪音去除品質的三十七項指標」。但 Laura 直接說:有些東西就是該讓人類做,而且永遠該讓人類做。
這個觀點對我來說滿震撼的。我們這個圈子很愛談自動化、eval pipeline、metrics-driven,但 Laura 直接打臉:在 taste 這件事上,找一個你信任品味的人來做決定,可能比一百行評分腳本更有效。
Underlord 的 agent harness 哲學:別 bitter lesson 自己
Nathan 問了一個技術面的問題:你們是怎麼讓 Underlord 「看見」影片的?
答案有點 anticlimactic:Descript 目前是把每一幀的視覺內容用 captioning(生成文字描述)轉成文字,再餵給 agent。Laura 直接承認這是現階段的弱項,多模態理解是 Underlord agent quality team 的第一優先,未來幾個月會看到大幅升級。
但 agent 整體架構的設計哲學就很有意思。她明確講出來:我們不要 bitter lesson 自己。
對不熟悉這個概念的讀者解釋一下:bitter lesson 是 Rich Sutton 那篇有名的論文,講的是 AI 領域反覆驗證的一件事,靠人類專業知識堆出來的方法,最終都會被「讓更大的算力跑更通用的方法」打敗。Descript 的策略是:
- 不嘗試訓自己的通用 reasoning model(打不過大實驗室)
- 寫一個非常 generalized 的 agent harness
- 提供一堆低層級的 Descript 專屬工具(這是 moat)
- 接上每一代最強的 frontier model(Claude、GPT、Gemini)
- 新模型出來十五分鐘內 eval 完上線
這個策略基本上是「frontier model 的順風車」。她的賭注是:通用智能會繼續進步,每次進步我們都能立刻吃到。如果 Descript 自己花兩年訓一個專屬 agent model,可能訓完就被新版 Claude 海放。
她還分享了一個三級評分標準在內部跑 eval:第一級「沒搞砸」(agent 至少沒把你的影片弄壞),第二級「做了你叫它做的事」,第三級「做得好」。目前 Descript 第一級接近百分之百,第二級約九成,第三級沒到八成,這也是她設定年底要拉到的目標。讀產品團隊的 KPI 設計能讀到這種誠實程度滿少見。
AI 時代的定價陣痛期:點一次按鈕燒掉幾塊美金的尷尬
這段是我最有感的。Nathan 問:Descript 現在有些按鈕點下去會花掉幾塊美金 credit,這種新的成本結構你們怎麼設計?
Laura 直接承認:「我自己當消費者,也覺得這種感覺很差。」
她接著說 Descript 的設計原則:把 credit 設計成跨功能的共用池,不再是「你有多少 AI 語音額度、多少 filler word 額度」(那會讓 podcaster 跟 YouTuber 拿到完全不對稱的價值)。然後設計目標是讓不到百分之五的活躍用戶每月會碰到上限要加購。
如果是百分之五十的用戶都在加購,那就完蛋了,整個 app 會像走進主題樂園每樣東西都要錢一樣難受。
她還預測了一件我覺得會發生的事:目前的 token-based 定價是過渡期,最終會走到 outcome-based pricing。 不是按你燒了多少 token 計費,是按你成功 export 了一支影片計費,類似這種。模型成本會一路降,當降到一定程度,按結果計價才合理。
我自己在規劃 SaaS 產品定價的時候也卡在類似問題。我之前寫過SaaS 要死了嗎?從 Klarna CEO 砍掉一半員工的故事聊起,講的就是 AI agent 怎麼把 SaaS 的傳統定價邏輯整個翻過來。Laura 這邊講的是同一件事的另一面:當每次點擊的成本是浮動的,你的訂閱方案就要被迫做一堆不自然的妥協。這個陣痛期會持續一陣子,但走出來之後整個軟體商業模式會長得跟現在很不一樣。
對 2028 年自動化研究員,她的態度是「你先把賭注寫下來」
Nathan 引用 OpenAI 公開講過的時程:他們預期 2028 年三月會有 autonomous AI researcher。也就是不到兩年後。
Laura 的反應很 mature:「當有人跟你講這種話,最重要的事情是讓他把賭注寫在紙上,講清楚這個 autonomous researcher 具體能做什麼、不能做什麼。」
她說只要進到具體層級,多半會發現這個未來比 topic sentence 描述的合理很多。「在六個月內不會再有任何白領工作」這種句子,回去看原始論述會發現完全不是這樣。
這個態度我很欣賞。AI 圈最近一年的論述膨脹得很厲害,每個禮拜都有新的「再 X 年世界就完全不一樣了」,但很少人願意把賭注寫成可驗證的具體陳述。Laura 的工作是經營一個年增七成五的軟體公司,她沒有時間陪每個論述潮流起舞。
結尾:藝術不會被演算法吞掉
最後 Nathan 問了一個我也很好奇的問題:未來會不會就是無限 slop?
Laura 的回答漂亮。她說,問這個問題的人通常是科技人或經濟學家,但 content 不只是商業,也是藝術。藝術一直都在用意想不到的方式回應新技術。
相機發明之後,沒有人再對「畫得像照片」這件事有興趣,整個繪畫的方向被改寫。Generative AI 大概也會這樣。會有真正有 taste 的創作者用這個工具做出讓所有人驚訝的東西,然後行銷團隊跟風偷概念,就像《穿著 Prada 的惡魔》裡那段藍色毛衣的橋段一樣,從高訂走到 Marshall's 折扣區。
看向未來看見惡夢很容易,特別是在現在這個對科技這麼疑神疑鬼的時代。但我真的很期待看到藝術家會用這個工具做出什麼。
這句話我覺得是整集最值得記下來的。我們這個產業話題很多時候被 doomer 跟 hype-er 兩端拉扯,中間很少留空間給「繼續工作,看會長出什麼」這種務實態度。Laura 講話有那種看了夠多週期的人才會有的安定感。
我自己用 Descript 做 podcast 已經幾年,過程中眼睜睜看著 Underlord 一路長大。這集聽完我對這家公司的策略更有信心,也對 AI 創作工具的競爭格局更有判斷感。
如果這類產業內幕跟產品策略分析合你胃口,我的部落格 wilsonhuang.xyz 每天都會更新類似的內容,歡迎訂閱追蹤。
Sources:
推薦閱讀
喜歡這篇文章嗎?
訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。
💌 隨時可以取消訂閱,不會收到垃圾郵件


