Coinbase CEO 預測：80% AI 工作負載將在 12-18 個月內轉向便宜 99% 的模型

廉價、無限的 AI 時代即將終結——一個分層的智能市場正在形成。

Coinbase 執行長 Brian Armstrong 預測，隨著產業面臨補貼式定價的不可持續性，80% 的人工智慧工作負載將在 12 至 18 個月內轉向成本比當今前沿系統便宜 99% 的模型。

「瓶頸將是能源和算力，而非更好的模型，」Armstrong 週日在 X 平台發文，回應投資人 Tommy Shaughnessy 關於計量 API 定價正將企業 AI 支出推升至遠超過固定費率訂閱預期的分析。Armstrong 表示，Coinbase 已在適當情況下將提示路由至更便宜的模型，即使代幣使用量呈指數級增長，其 AI 成本仍「大致持平」。

Armstrong 的預測發表之際，微軟旗下的 GitHub Copilot 於 6 月 1 日從固定訂閱制轉為代幣計費，部分用戶帳單漲幅高達 1,700%。一名用戶貼出內部成本估算，顯示其月費從 44.68 美元躍升至 754.29 美元；另一名用戶則預估帳單將達 847 美元。這一定價改革反映了一個更廣泛的現實：根據 Shaughnessy 的數據，OpenAI 的營運利潤率接近負 122%，代表該公司完全依賴外部資本來補貼 GPU 採購與推理成本。

雙層智能市場

Armstrong 的框架將 AI 使用分為兩類。需要頂尖效能的 20% 工作負載——包括科學研究、智能體協調以及他所謂的「智商極致化」——將繼續在 Anthropic 的 Opus 4.8 或 OpenAI 的 GPT-5.5 等前沿模型上運行。其餘 80% 將轉向更便宜的替代方案，他將此比作消費硬體市場：大多數買家不會選擇 MacBook 或電競 PC 的頂級規格。

經濟面已支持這一分化。根據 Shaughnessy 的數據，DeepSeek V4 在 SWE-bench 編碼基準測試中的表現與 Anthropic 的 Claude Opus 相當，但成本僅為後者的約三十分之一。Hugging Face 執行長 Clement Delangue 引用史丹佛大學的研究顯示，在實際對話與推理查詢中，本地模型準確率從 2023 年的 23.2% 上升至 71.3%，而能耗與 API 呼叫成本僅為一小部分。

Box 執行長 Aaron Levie 認為 Armstrong 提出的 99% 數字「有點極端」，但他同意 AI 使用將出現分層，高端工作由領先模型處理，大量任務則由廉價模型執行。「智能配置將極其重要，」Harvey 共同創辦人 Winston Weinberg 寫道。Glean 共同創辦人 Tony Gentilcore 則表示 Armstrong 的分析「一針見血」，並補充說「金融市場是唯一將 Opus 價格外推到無限規模的領域。」

投資視角

向更便宜模型的轉變威脅著 OpenAI、微軟和 Anthropic 等高階 AI 供應商的營收模式，這些公司一直依賴補貼式訂閱來建立市場佔有率。如果 80% 的工作負載轉向低成本替代方案，前沿模型的潛在市場將急劇縮小。能夠實現高效推理的公司——包括開源模型供應商和路由基礎設施業者——將從中受益。Nvidia 的 H100 和 B200 GPU 支撐了大多數前沿模型的訓練，但其前景更為複雜：算力需求可能增長，但隨著廉價替代方案的普及，定價能力可能遭到侵蝕。

本文僅供資訊參考，不構成投資建議。