ICCV新范式:世界模型驱动L4自动驾驶,最新AI资讯解读
type
status
date
slug
summary
tags
category
icon
password
网址

在近期的计算机视觉顶级会议ICCV上,一个明确的信号正在释放:自动驾驶的竞速已进入下半场。以特斯拉和理想汽车为代表的行业领军者,不约而同地将目光投向了同一个方向——统一世界模型(World Model)和训练闭环(Training Closed-loop)。这不仅是一次技术路线的演进,更是一场迈向L4级自动驾驶乃至通用人工智能(AGI)的深刻范式革命。想要了解最新最全的AI新闻,可以访问AI门户 AIGC.Bar (https://aigc.bar)。
为什么“数据闭环”已不够用?
自动驾驶的上半场,是端到端(End-to-End)架构的时代。通过海量真实路采数据进行模仿学习,模型的驾驶能力得到了飞速提升,这便是我们熟知的数据闭环——采集、训练、评估、部署的循环。
然而,这一模式的瓶颈也日益凸显。理想汽车的VLA模型负责人詹锟指出,单纯依赖模仿学习,AI模型的能力上限被锁定在“人类驾驶员的平均水平”。它能很好地处理常见场景,却难以应对数据稀疏的边缘场景(Corner Cases),而这些场景恰恰是实现完全自动驾驶的关键。为了突破这一天花板,技术范式必须升级。
于是,训练闭环应运而生。它在数据闭环的基础上,引入了生成式的世界模型和强化学习。AI不再是被动地模仿数据,而是能够在虚拟世界中主动探索、试错、并根据环境反馈进行迭代优化,从而学会超越人类数据限制的驾驶策略。这标志着自动驾驶的训练方式从“经验驱动”向“目标驱动”的根本性转变。
核心引擎:解读“世界模型”的真正内涵
“世界模型”是实现训练闭环的核心。需要明确的是,这里所说的世界模型并非简单的仿真器,而是一个综合性的、能够理解并推演物理世界运行规律的大模型系统。根据理想汽车的分享,它主要包含以下几个层面:
- 环境构建:高保真地重建或生成复杂的动态驾驶环境。
- 智能体构建:模拟环境中其他交通参与者(车辆、行人等)的行为和意图。
- 反馈构建:建立一套精确的奖励(Reward)机制,用于指导AI模型的学习方向。
- 场景推演:在给定条件下,对未来可能发生的多种交通场景进行推演和预测。
这个强大的世界模型系统,为自动驾驶的人工智能大脑提供了一个可控、可重复、且无限丰富的“虚拟训练场”。它主要具备三大核心能力,共同构成了训练闭环的坚实支柱。
世界模型的三大支柱:从仿真到强化学习
为了让训练闭环高效运转,世界模型通过以下三大能力协同工作,推动VLA模型向L4级别持续进化。
1. 区域级的仿真与评估
这是实现长时序、高保真评估的基础。理想汽车采用了重建(Reconstruction)与生成(Generation)相结合的路线。
- 重建:利用3DGS(三维高斯泼溅)等技术,如被ECCV和ICCV收录的Street Gaussians、Hierarchy UGP等成果,能够将真实场景进行像素级还原,保证了静态环境的真实性。
- 生成:通过生成式AI技术,可以低成本、大规模地创造出全新的、甚至是现实世界中极其罕见的边缘场景,如极端天气、复杂光照、突发事故等。
詹锟认为,未来生成的占比将不可逆转地持续增加,因为这能以最高效的方式解决数据多样性和均衡性的问题。
2. 合成全新的驾驶数据
世界模型的第二大能力是合成数据,以弥补真实采集数据的不足。传统方式获取的数据往往集中在晴天、城市道路等常规场景。而通过场景编辑、迁移和全场景生成,可以创造出覆盖更广、种类更复杂的均衡数据集。这使得模型能够在训练阶段就接触到各种极端情况,从而大幅提升其鲁棒性和泛化能力。
3. 强化学习的世界引擎
这是最具挑战性,也是价值最高的一环。它让VLA模型能够在虚拟世界中自由探索,通过与环境的交互来学习最优驾驶策略。这其中有五大关键因素,包括世界模型、3D资产、仿真智能体、奖励模型和性能优化。
其中,仿真智能体被认为是当前最棘手的难题。要真实地模拟其他车辆和行人的复杂交互行为,其难度甚至不亚于实现单车L4。理想汽车通过设定目标函数和奖励函数来约束多智能体的行为,并通过调整奖励权重来生成多样化的交互样本,从而为VLA模型提供高质量的博弈训练环境。
技术飞轮的基石:商业与研产的双重闭环
理想汽车之所以能率先在自动驾驶领域提出并实践这一新范式,离不开其稳固的商业基础和高效的研发体系。
- 商业闭环:率先实现盈利,保证了每年超百亿的持续高强度研发投入。
- 底层系统:自研的整车操作系统理想星环OS,通过跨域融合设计,打通了车辆的感知、决策和执行链路,大幅缩短了系统延迟(如AEB刹停距离缩短7米),为上层先进算法的落地提供了坚实平台。其开源举措也正在构建一个强大的产业生态。
- 研产闭环:理想的研究课题直接来源于量产团队在实践中遇到的瓶颈,确保了前沿研究成果(如被顶级会议收录的DriveVLM、RoboPearls等)能够快速应用于量产车辆,形成从问题到解决方案的高效闭环。
迈向物理AI:汽车公司的终局是AI
从特斯拉到理想汽车,ICCV上的分享清晰地表明,领先的汽车公司正在加速向人工智能公司转型。它们的目标早已超越了制造一辆好车,而是要打造一个能够在物理世界中自主移动、决策的“空间机器人”。
这场从数据闭环到训练闭环的范式迁移,是通往L4乃至更高级别自动驾驶的必由之路。它考验的不仅是算法能力,更是包括算力、底层系统、商业模式和研发体系在内的综合实力。这股由大模型驱动的浪潮,正在深刻重塑整个汽车行业和人工智能的未来。
想要获取更多关于自动驾驶、大模型和AGI的前沿AI资讯,敬请关注AI门户网站 AIGC.Bar (https://aigc.bar),掌握最新动态。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)