
一間公司一年燒七百萬美金在 Claude Code 上:Dylan Patel 拆解 AI Token 的供給與需求
TL;DR
- SemiAnalysis 今年花在 Claude Code 的錢,從去年的幾萬美金直接暴增到現在每年七百萬美金的 run rate
- 員工薪資總支出大約兩千五百萬美金,AI 支出占比已經超過百分之二十五,照這速度走到年底可能超過百分之一百
- Anthropic ARR 從九十億跳到四百億以上,毛利率下限七成二,還是被算力不足逼著限流
- Opus 4.7 才剛上線,Anthropic 內部還藏著代號 Mythos 的下一代模型,兩個月內從 L4 工程師等級跳到 L6
- Memory 是接下來兩年最大的瓶頸,DRAM 價格還有機會再翻兩到三倍,TSMC 的 CapEx 到 2028 年可能衝破一千億美金
- Dylan 預言三個月內會有大規模反 AI 抗議潮,AI 產業的公關正在失控
Invest Like the Best 是 Patrick O'Shaughnessy 主持的長青商業訪談節目,Patrick 同時是 Colossus 媒體網路創辦人和 Positive Sum 的 CEO,以創投人的角色投資早期公司。這集請來的來賓 Dylan Patel 是 SemiAnalysis 的創辦人、CEO 兼首席分析師。SemiAnalysis 是一間專門追蹤半導體供應鏈、AI 基礎建設和資料中心的研究公司,客戶涵蓋頂級對沖基金、創投和超大型雲端業者。Dylan 是過去兩年 AI 算力產業最被引用的分析師之一,從 GPU 價格、資料中心耗電量,到每間 AI 實驗室的營收估算,他的數字幾乎變成產業基準線。這集是 Patrick 第二次訪問他,主題聚焦在 token 的供給與需求。
一間公司的 AI 帳單,能瘋狂到什麼程度
Dylan 一開口就丟出一組誇張但真實的數字。SemiAnalysis 去年一整年花在 ChatGPT、Claude 訂閱上的總額,是幾萬美金等級的小錢。今年從一月開始 spend 起飛,到現在是「每年七百萬美金」的支出速度,而且還在上升。採訪時他補充說,上週跟 Patrick 提到的還是五百萬,一週過去已經變七百萬。
對照組是 SemiAnalysis 的薪資總支出,大約兩千五百萬美金。也就是說 AI 支出已經占薪資的百分之二十五以上,照這個斜率走到年底,會突破百分之百。這真的是字面意義的超過,我沒在誇飾。
Dylan 說他公司裡最兇的使用者,單日 Claude Code spend 可以到幾千美金。單人、單天、單一個工具。更反直覺的是,這些重度使用者很多不是工程師。帶頭導入的公司總裁 Doug O'Loughlin 本人不寫 code,反而是他一個個把非技術背景的同事拉進 Claude Code 的坑。
兩個實例,把我嚇到
光看數字還沒那麼震撼,Dylan 舉的兩個案例才讓人意識到這些 token 到底在幹嘛。
第一個是 SemiAnalysis 在 Oregon 的逆向工程實驗室。這實驗室花了一年半建置,用高階顯微鏡把晶片剖開做結構分析,是業界只有少數人能做的專業活。結果公司裡一位成員花了「幾千美金」的 Claude token,做出一個跑在 CoreWeave 伺服器上的 GPU 加速應用:丟一張晶片照片進去,它會自動標記每個區域是什麼材料,銅、鉭、鍺、鈷,全部標好,還能做整層的有限元分析。這位成員以前在 Intel 工作,他說過去這需要「一整個團隊」去建置和維護。
第二個案例更猛。Malcolm 是個經濟學家,之前在大型銀行的經濟研究部,那部門有一兩百人。他上 Claude Code 之後,把 FRED 資料、勞動統計局(BLS)的兩千項工作任務、各種 API 全部串起來,自己跑迴歸、建評估框架,最後產出一個叫「Phantom GDP」的新指標:評估那兩千項工作裡有多少比例能被 AI 做掉,做掉之後會產生多少通縮效應。
Malcolm 說這件事如果由他原本那個兩百人團隊做,至少要一年。他一個人,幾週搞定,用他自己的話講叫「cracked out on Claude」。
這讓我想起 Jake Paul 在 20VC 那集講的:AI 時代下,一個人能做五個人、十個人、二十個人的事,而且成本從百萬美金壓到幾千美金。這不再是投影片上的預測,是 Dylan 自己公司正在發生的事。
所有人都想用最新最貴的模型
這段聊到一個很有意思的人性現象。Patrick 說他飛機上被 rate limit,然後一看 Opus 4.7 上線,馬上覺得不能再用 4.6。幾週前他還覺得 4.6 很爽,現在 4.7 一出,前一代瞬間變垃圾。
Dylan 的反應更誇張。他說過去一個半月最經典的記憶,是他和朋友 Leopold 跪在 Anthropic 共同創辦人面前求他給 Mythos 的存取權,對方還要裝作沒這回事。Mythos 是 Anthropic 內部那個「不敢放出來」的下一代模型,Dylan 形容它是近兩年最大的一次能力跳升。
更誇張的是 Anthropic 在 model card 裡直接承認 Mythos 在 cyber 相關任務上被刻意「弄得比較差」才公開釋出,原因是怕這東西對世界造成衝擊。一家公司發展到要主動削弱自己產品能力的地步,供給端的張力可見一斑。
能力跳得多快?用 Anthropic 內部的說法,Opus 4.6 大概是 L4 軟體工程師水準,Mythos 已經到 L6,也就是資深工程師等級。兩個月內從 junior 跳到 senior,這個速度會讓任何在產業裡寫過 career ladder 的人背脊發涼。
Anthropic 的毛利率為什麼這麼猛
這是這集我覺得最具體的一段分析。Anthropic 的 ARR 從去年的九十億衝到四百億以上,但他們的算力並沒有跟著翻倍。Dylan 的推算邏輯是:就算假設所有新增算力都給了 inference、研發算力完全沒減,毛利率下限也有七成二。而實際情況是研發算力其實也吃掉一大塊(Mythos 和 Opus 4.7 都從這裡出來的),所以實際毛利率只會更高。
對照去年年初那次 Anthropic 財務外流,市場看到的數字是三十幾趴毛利率。一年內從三十幾趴跳到七十幾趴,這在任何產業都是異常值。原因只有一個:token 的需求遠大於 Anthropic 能供給的產能,他們不需要降價搶客,反而還要主動限流、卡 rate limit。
Dylan 給的建議很直接:如果你有本錢,一定要去簽 Anthropic 的 enterprise 合約,付 per-token 的費用,不要走固定訂閱。因為訂閱制會被 rate limit 壓到動不了,per-token 貴一點但能讓你把 token 用在最高價值的任務上。
這邏輯推到最後,他說未來一兩年 AI 業務的本質就是「token 的套利」:你付錢買最聰明的 token,再把它指向最高價值的任務去換錢。三四年後模型會自己決定怎麼用 token 最有效,那時候又是另一個世界了。這個方向跟 Klarna CEO 說 SaaS is dead 那篇講的邏輯其實是一致的:軟體的邊際成本在崩潰,剩下有價值的是誰能把 AI 的能力轉成商業結果。
供給端:memory 還要再翻兩到三倍
供給端的部分是 SemiAnalysis 的本行。Dylan 的核心論點是:所有有脈搏的東西都被搶光了。從 GPU、memory、optics、logic、PCB 的銅箔、玻璃纖維,一路到 ASML 光刻機用的 Carl Zeiss 鏡頭,整條供應鏈處於嚴重供不應求的狀態。
最嚴重的是 memory。DRAM 和 NAND 的產能每年只能成長百分之二十到三十,這是物理和資本支出的硬上限。就算 memory 廠在 2025 年底看到需求訊號立刻反應,新增產能也要等到 2028 年才會真的進來。結論:DRAM 價格還有機會再翻兩到三倍。
Logic 部分 TSMC 剛公布今年 CapEx 是五百七十四億美金,SemiAnalysis 推算到 2027 或 2028 年這數字可能衝到一千億美金。這聽起來誇張,但 Dylan 認為是真實的可能性。這個數字一旦發生,會把整個上游供應鏈(Lam Research、Applied Materials、ASML、MKS Instruments)的 order book 鞭得更遠更長。
關於 TSMC 的毛利率,Dylan 提到一個有趣觀察。TSMC 的晶圓漲價幅度只有個位數百分比,memory 廠直接漲三位數百分比。他說 TSMC「就是一群好人」,不太會極限榨取客戶。這點我在 銀行股和晶片股同時交卷 那篇也寫過,TSMC 本季毛利率衝到百分之六十六是歷史新高,但跟 memory 廠比其實算很節制。
CPU 也被打到爆,這件事很少人講
這段我覺得一般讀者不太容易從主流報導裡聽到:CPU 的需求也在爆炸。
為什麼?因為強化學習(RL)的 environment 在吃 CPU。當 AI 模型跑 RL 訓練時,它要在一個模擬環境裡試錯、評分、迭代,這些 environment 本身跑在 CPU 上。加上每個人都在用 Claude Code 產出一堆部署代碼,那些代碼跑在 Vercel、AWS 的 instance 上,也都是 CPU。
GPU 和 ASIC 負責「思考」,CPU 負責「執行環境」和「最後交付」。市場過去兩年只聚焦 NVIDIA,CPU 這條線被嚴重低估。
軟體 only singularity 只是個過渡
這段超短但我覺得關鍵。Dylan 對「軟體 only singularity」這概念態度很冷淡,他認為那只是一個短暫階段。一旦軟體端的實作變便宜,接下來一定會往硬體蔓延,特別是機器人。
他的判斷:六到十八個月內會看到機器人領域的關鍵突破,重點是 few-shot learning。現在主流的 Vision Language Action 模型(VLA,讓機器人同時理解視覺、語言、動作的模型)資料效率太差,scale 不起來。但人類學東西看一兩次就會,這表示有一種更 sample efficient 的架構正在被研究出來。一旦這個突破發生,你會看到機器人從「拍廣告用的噱頭」變成真的能折衣服、擦黑板的工具。
Dylan 的反直覺預測:三個月內大規模反 AI 抗議
Patrick 問 Dylan 三個月後再訪,他覺得會發生什麼。Dylan 的答案出乎意料:「大規模的反 AI 抗議」。
他的論據是:AI 在美國的好感度民調已經低於 ICE、低於大部分政治人物。Anthropic 每個月增加十億美金的營收,這些錢對應到某個地方就是有人失業、工作流程改變、被取代的焦慮。過去積累多年的結構性問題,很快會被引導到「都是 AI 害的」這個敘事上。Sam Altman 家門口被丟了兩次汽油彈,網路留言還在叫好。
他對 Sam Altman 和 Dario Amodei 的吐槽也很直接:這兩個人太不親民、太不會講話,每次上節目只會讓一般大眾更討厭他們。Sam 上 Tucker Carlson 的效果「大概是讓所有共和黨選民多恨 OpenAI 一輪」。
這點跟我之前寫的 AI 營收爆炸但民眾好感度比伊朗還低 幾乎是同一個論點。AI 產業的公關正在失控,而失控的速度比營收成長還快。
我自己的幾個 takeaway
聽完這集有幾個點我想額外講一下。
第一,token 的真實價格已經不是看 API 標價,而是看「你能不能拿到」。rate limit、enterprise 合約、VIP 通道,這些才是接下來一年最重要的變數。沒有 Anthropic 的直接窗口,你就只能撿別人剩下的產能。
第二,能力差距正在現金化。Mythos 不給你、給頂級銀行,這跟公平不公平無關,純粹是資本主義在算力稀缺時的自然結果。Dylan 直接說他希望 Anthropic 會給 SemiAnalysis 早一點的存取權,好讓他們「把競爭對手壓死」。這話講得很誠實,也反映了業內人怎麼思考。
第三,我自己也是 token 的重度使用者。我的 token spend 在過去幾週也往上噴,每次拿到新工具,第一件事就是想它能幫我產出什麼更有價值的東西。這種 FOMO 我在 跑在 AI 的輪圈上 寫過,感覺沒有減輕的跡象。
最後 Dylan 講了一句超狠的話:「如果你沒有用更多 token 去創造價值並捕捉價值,這輩子都逃不出永久的底層階級。」這話很難聽,但越想越覺得他不是在嘴砲。模型每個月在進化,算力分配越來越集中,你要嘛跟上這個循環,要嘛被定價在循環之外。
Dylan 預言三個月後會有反 AI 抗議潮。那時候剛好可以回頭看這集 podcast,對照一下他猜中了多少。
如果這類產業觀察對你有幫助,我的部落格 wilsonhuang.xyz 會持續更新 AI 和 crypto 產業的第一手整理,歡迎訂閱追蹤。
Disclaimer 此篇非投資建議,以上均為個人觀點,請 DYOR。
Sources:
推薦閱讀
喜歡這篇文章嗎?
訂閱電子報,每週收到精選技術文章與產業洞察,直送你的信箱。
💌 隨時可以取消訂閱,不會收到垃圾郵件


