Key Takeaways:
- Z.ai 的 GLM-5.2 在 SWE-bench Pro 與 FrontierSWE 基準測試中擊敗 GPT-5.5
- API 定價為每百萬 Token 5.80 美元,遠低於 GPT-5.5 的每百萬 Token 35.00 美元
- MIT 開源授權允許在地端部署,且無地理限制
Key Takeaways:

Z.ai 的 GLM-5.2 在關鍵程式碼基準測試上以極低成本追平甚至超越 OpenAI 的 GPT-5.5 與 Anthropic 的 Claude Opus 4.8,而其 MIT 開源授權更讓企業得以繞過地理限制。
Z.ai 發布 GLM-5.2,這是一個擁有 7530 億參數的開源權重模型,在多項長時序程式碼基準測試中擊敗 GPT-5.5,同時 API 價格僅為其六分之一,加劇了前沿 AI 市場的競爭。
「GLM-5.2 是首個在 Terminal-Bench 上突破 80% 的開源權重模型,並且擊敗所有其他開源模型,」Cline IDE 團隊在 X 平台上宣布與該開源程式碼環境達成首日整合時如此表示。
該模型在 SWE-bench Pro 上獲得 62.1 分,超越 GPT-5.5 的 58.6 分及其前代 GLM-5.1 的 58.4 分。在測試長時序任務完成能力的 FrontierSWE 上,其得分為 74.4%,僅落後 Claude Opus 4.8 的 75.1% 不到一個百分點。其 100 萬 Token 的上下文窗口——從 GLM-5.1 的 20 萬 Token 擴展而來——由全新的 IndexShare 架構驅動,該架構在每四層稀疏注意力層之間重複使用相同的索引器,在最大上下文長度下將每個 Token 的計算 FLOPs 減少了 2.9 倍。
API 定價為每百萬輸入 Token 1.40 美元、每百萬輸出 Token 4.40 美元,相比之下 GPT-5.5 分別為 5.00 美元與 30.00 美元。MIT 開源授權允許企業在地端部署模型,消除了供應商鎖定的問題,並繞過了近期美國出口管制指令後封鎖外國存取 Anthropic 的 Claude Fable 5 的地理限制。
在 Design Arena 群眾外包基準測試中,GLM-5.2 以 1,360 的 ELO 評分奪得第一,甚至擊敗了 Claude Fable 5。在 Code Arena 這個由全球數百萬用戶進行盲測的前端開發評估系統中,該模型在所有可用模型中獲得最高排名。該模型還引入了可選擇的「思考模式」——「Max」設定使用約 8.5 萬個輸出 Token 每任務來推動峰值智慧,而「High」則將 Token 消耗減半,性能損失極小。
開發者生態系統迅速響應。Kilo Code、Cline 與 Eigent AI 均確認首日支援。GLM 程式碼方案的訂閱層級起價為 Lite 方案每月 12.60 美元、Pro 方案 50.40 美元、Max 方案 112.00 美元,每個方案針對逐步加重的程式碼庫工作負載。
知識圖譜(02513.HK),即 Z.ai 在香港上市的母公司,在公告發布後上漲 0.7%,做空交易量達到 9275 萬美元——2% 的做空比率顯示出顯著的交易者佈局。中金公司將其目標價上調 39% 至 1250 港元,維持「跑贏大盤」評級,而摩根大通則將其目標價上調 47% 至 1400 港元,理由是該公司在程式碼能力方面的領先地位。
競爭影響不僅限於基準測試。隨著 DeepSeek-V4-Pro 每百萬輸出 Token 收費 0.87 美元、GLM-5.2 收費 4.40 美元,開源權重模型與專有模型之間的差距已縮小到領先實驗室可能處於「90% 以上的利潤率」——正如 AI 觀察者 Lisan al Gaib 在 X 平台上所言。對於企業而言,能夠在不受限制的 MIT 授權下於主權基礎設施上運行前沿級 AI,消除了採用的一大關鍵障礙——尤其對於位於受美國出口管制影響司法管轄區的組織而言。
本文僅供資訊參考,不構成投資建議。