(资料图片)
·该论文提出了首个感知决策一体化的端到端自动驾驶大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河,标志着自动驾驶技术的重要突破。在UniAD中,多目标跟踪准确率超越最佳性能20%,车道线预测准确率提升30%,预测运动位移和规划的误差分别降低38%和28%。
·这是近十年中国学术机构作为第一单位首次获CVPR最佳论文奖。论文由上海AI实验室、武汉大学及商汤科技联合撰写。
6月21日,全球人工智能和计算机视觉领域顶级国际会议CVPR2023(IEEE Conference on Computer Vision and Pattern Recognition)在加拿大温哥华正式公布奖项。上海人工智能实验室、武汉大学及商汤科技联合论文《以路径规划为导向的自动驾驶》(Planning-oriented Autonomous Driving,UniAD)获最佳论文奖。这是近十年中国学术机构作为第一单位首次获CVPR最佳论文奖。该论文提出了首个感知决策一体化的端到端自动驾驶大模型,开创了以全局任务为目标的自动驾驶大模型架构先河,标志着自动驾驶技术的重要突破。
一年一度的CVPR是计算机视觉领域的顶级会议。2023年,CVPR大会的论文投稿总量9155篇,其中2359篇论文被接收,接收率25.78%。而此次获奖论文是CVPR历史上第一篇以自动驾驶为主题的最佳论文,该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,能够更好协助行车规划。
自动驾驶是一个高度复杂的技术体系,不仅需要多个学科领域的知识和技能,包括传感器硬件、机器学习、多模态融合等内容,还需要适应不同国家与地区的道路规则和交通文化,与车辆及行人进行良好交互,以实现高度的可靠性和安全性。自动驾驶系统包含三大主任务:感知、预测和规划。当前,业界主流的方案架构分别采用不同的模块来处理这些具体任务,但由于各模块并非以驾驶为最终目标进行优化,因而自动驾驶系统的整体性能提升受到限制。
在UniAD中,研究人员首次将感知、预测和规划等三大类主任务、六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划)整合到一个基于Transformer的端到端网络框架下,实现了全栈关键任务驾驶通用模型。在nuScenes真实场景数据集下,UniAD的所有任务均达到领域最佳性能(State-of-the-art,SOTA),尤其是预测和规划效果远超此前最佳方案。其中,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移和规划的误差则分别降低38%和28%。上海AI实验室青年科学家李弘扬介绍,凭借其充分的可解释性、安全性、与多模块的可持续迭代性,UniAD是目前最具希望实际部署的端到端模型。基于UniAD的纯视觉自动驾驶方案可为产业界提供全新研发思路,在节省大量硬件成本的同时,有助于提高出行的安全性与舒适性,该科研成果在产业界的落地应用将推动自动驾驶技术与产品的规模化发展。