Z.ai 開源 GLM-5.2，以六分之一成本在程式碼基準測試中擊敗 GPT-5.5

Z.ai 的 GLM-5.2 在關鍵程式碼基準測試上以極低成本追平甚至超越 OpenAI 的 GPT-5.5 與 Anthropic 的 Claude Opus 4.8，而其 MIT 開源授權更讓企業得以繞過地理限制。

Z.ai 發布 GLM-5.2，這是一個擁有 7530 億參數的開源權重模型，在多項長時序程式碼基準測試中擊敗 GPT-5.5，同時 API 價格僅為其六分之一，加劇了前沿 AI 市場的競爭。

「GLM-5.2 是首個在 Terminal-Bench 上突破 80% 的開源權重模型，並且擊敗所有其他開源模型，」Cline IDE 團隊在 X 平台上宣布與該開源程式碼環境達成首日整合時如此表示。

該模型在 SWE-bench Pro 上獲得 62.1 分，超越 GPT-5.5 的 58.6 分及其前代 GLM-5.1 的 58.4 分。在測試長時序任務完成能力的 FrontierSWE 上，其得分為 74.4%，僅落後 Claude Opus 4.8 的 75.1% 不到一個百分點。其 100 萬 Token 的上下文窗口——從 GLM-5.1 的 20 萬 Token 擴展而來——由全新的 IndexShare 架構驅動，該架構在每四層稀疏注意力層之間重複使用相同的索引器，在最大上下文長度下將每個 Token 的計算 FLOPs 減少了 2.9 倍。

API 定價為每百萬輸入 Token 1.40 美元、每百萬輸出 Token 4.40 美元，相比之下 GPT-5.5 分別為 5.00 美元與 30.00 美元。MIT 開源授權允許企業在地端部署模型，消除了供應商鎖定的問題，並繞過了近期美國出口管制指令後封鎖外國存取 Anthropic 的 Claude Fable 5 的地理限制。

在 Design Arena 群眾外包基準測試中，GLM-5.2 以 1,360 的 ELO 評分奪得第一，甚至擊敗了 Claude Fable 5。在 Code Arena 這個由全球數百萬用戶進行盲測的前端開發評估系統中，該模型在所有可用模型中獲得最高排名。該模型還引入了可選擇的「思考模式」——「Max」設定使用約 8.5 萬個輸出 Token 每任務來推動峰值智慧，而「High」則將 Token 消耗減半，性能損失極小。

開發者生態系統迅速響應。Kilo Code、Cline 與 Eigent AI 均確認首日支援。GLM 程式碼方案的訂閱層級起價為 Lite 方案每月 12.60 美元、Pro 方案 50.40 美元、Max 方案 112.00 美元，每個方案針對逐步加重的程式碼庫工作負載。

知識圖譜（02513.HK），即 Z.ai 在香港上市的母公司，在公告發布後上漲 0.7%，做空交易量達到 9275 萬美元——2% 的做空比率顯示出顯著的交易者佈局。中金公司將其目標價上調 39% 至 1250 港元，維持「跑贏大盤」評級，而摩根大通則將其目標價上調 47% 至 1400 港元，理由是該公司在程式碼能力方面的領先地位。

競爭影響不僅限於基準測試。隨著 DeepSeek-V4-Pro 每百萬輸出 Token 收費 0.87 美元、GLM-5.2 收費 4.40 美元，開源權重模型與專有模型之間的差距已縮小到領先實驗室可能處於「90% 以上的利潤率」——正如 AI 觀察者 Lisan al Gaib 在 X 平台上所言。對於企業而言，能夠在不受限制的 MIT 授權下於主權基礎設施上運行前沿級 AI，消除了採用的一大關鍵障礙——尤其對於位於受美國出口管制影響司法管轄區的組織而言。

本文僅供資訊參考，不構成投資建議。