首页 技术

中国研究人员研发创新框架 可提升自动驾驶车辆预测和模拟驾驶条件的能力

2025-01-10 07:45 来源: 盖世汽车

盖世汽车讯 据外媒报道,中国北京大学(Peking University)与清华大学(Tsinghua University)的研究人员发表了一篇论文,介绍“用于驾驶的生成式预训练版本1(Generative Pre-training for Driving version 1,GPD-1)”的创新框架,旨在提升自动驾驶系统的能力。该方法对各种驾驶场景进行建模,以简化场景生成、运动规划和交通仿真等任务,从而提升自动驾驶车辆预测和模拟各种驾驶条件的能力。利用分层位置编码和矢量量化自动编码器等先进创新技术,GPD-1实现了此次技术集成。

中国研究人员研发创新框架 可提升自动驾驶车辆预测和模拟驾驶条件的能力

GPD-1(图片来源:azoai.com)

自动驾驶技术领域的进展

近年来,自动驾驶领域取得了显著进展,主要归功于人工智能(AI)和机器学习技术的进步。传统方法通常孤立地处理驾驶场景的特定方面,例如地图生成或运动预测。然而,由于驾驶环境中各种实体间互动的复杂性,将此类组件整合至一个统一的框架中仍面临着挑战。不过,通过利用大型数据集高效模拟和预测驾驶场景,研发生成式模型,特别是自回归变压器架构,提供了有发展前景的解决方案。

GPD-1:研发一个统一的生成式模型

在该篇论文中,研究人员介绍了GPD-1,一款旨在整合自动驾驶场景演变各个方面的模型。该框架采用标记来代表驾驶场景,其中包含自主车辆(ego vehicle)、代理和地图元素。利用一个自回归变压器,该框架能够按序处理此类标记,捕捉时间依赖性与空间关系,为驾驶场景提供强大的表示。此外,利用场景级注意力机制,可进一步促进帧内各标记之间的细微互动。

为了编码空间和时间信息,研究人员为自主车辆和代理标记研发了一款分层位置编码器,融合了二维(2D)位置和朝向信息。对于地图标记,采用矢量量化自动编码器(VQ-VAE)将自主车辆为中心的语义地图压缩成离散标记,有效降低复杂度,同时保持空间精确度。此种创新设计让GPD-1能够在交通仿真、场景生成、闭环仿真、地图预测和运动规划等任务中进行归纳,无需额外微调。

返回首页
相关新闻
返回顶部