重點摘要:
- Coinbase 執行長 Brian Armstrong 預測,80% 的 AI 工作負載將在 12-18 個月內轉向成本便宜 99% 的模型
- GitHub Copilot 於 6 月 1 日改採代幣計費,部分用戶帳單從 44 美元暴增至超過 800 美元
- OpenAI 營運利潤率接近負 122%,凸顯補貼式 AI 定價的不可持續性
重點摘要:

廉價、無限的 AI 時代即將終結——一個分層的智能市場正在形成。
Coinbase 執行長 Brian Armstrong 預測,隨著產業面臨補貼式定價的不可持續性,80% 的人工智慧工作負載將在 12 至 18 個月內轉向成本比當今前沿系統便宜 99% 的模型。
「瓶頸將是能源和算力,而非更好的模型,」Armstrong 週日在 X 平台發文,回應投資人 Tommy Shaughnessy 關於計量 API 定價正將企業 AI 支出推升至遠超過固定費率訂閱預期的分析。Armstrong 表示,Coinbase 已在適當情況下將提示路由至更便宜的模型,即使代幣使用量呈指數級增長,其 AI 成本仍「大致持平」。
Armstrong 的預測發表之際,微軟旗下的 GitHub Copilot 於 6 月 1 日從固定訂閱制轉為代幣計費,部分用戶帳單漲幅高達 1,700%。一名用戶貼出內部成本估算,顯示其月費從 44.68 美元躍升至 754.29 美元;另一名用戶則預估帳單將達 847 美元。這一定價改革反映了一個更廣泛的現實:根據 Shaughnessy 的數據,OpenAI 的營運利潤率接近負 122%,代表該公司完全依賴外部資本來補貼 GPU 採購與推理成本。
雙層智能市場
Armstrong 的框架將 AI 使用分為兩類。需要頂尖效能的 20% 工作負載——包括科學研究、智能體協調以及他所謂的「智商極致化」——將繼續在 Anthropic 的 Opus 4.8 或 OpenAI 的 GPT-5.5 等前沿模型上運行。其餘 80% 將轉向更便宜的替代方案,他將此比作消費硬體市場:大多數買家不會選擇 MacBook 或電競 PC 的頂級規格。
經濟面已支持這一分化。根據 Shaughnessy 的數據,DeepSeek V4 在 SWE-bench 編碼基準測試中的表現與 Anthropic 的 Claude Opus 相當,但成本僅為後者的約三十分之一。Hugging Face 執行長 Clement Delangue 引用史丹佛大學的研究顯示,在實際對話與推理查詢中,本地模型準確率從 2023 年的 23.2% 上升至 71.3%,而能耗與 API 呼叫成本僅為一小部分。
Box 執行長 Aaron Levie 認為 Armstrong 提出的 99% 數字「有點極端」,但他同意 AI 使用將出現分層,高端工作由領先模型處理,大量任務則由廉價模型執行。「智能配置將極其重要,」Harvey 共同創辦人 Winston Weinberg 寫道。Glean 共同創辦人 Tony Gentilcore 則表示 Armstrong 的分析「一針見血」,並補充說「金融市場是唯一將 Opus 價格外推到無限規模的領域。」
投資視角
向更便宜模型的轉變威脅著 OpenAI、微軟和 Anthropic 等高階 AI 供應商的營收模式,這些公司一直依賴補貼式訂閱來建立市場佔有率。如果 80% 的工作負載轉向低成本替代方案,前沿模型的潛在市場將急劇縮小。能夠實現高效推理的公司——包括開源模型供應商和路由基礎設施業者——將從中受益。Nvidia 的 H100 和 B200 GPU 支撐了大多數前沿模型的訓練,但其前景更為複雜:算力需求可能增長,但隨著廉價替代方案的普及,定價能力可能遭到侵蝕。
本文僅供資訊參考,不構成投資建議。