网站首页 | 网站地图

人民论坛网·国家治理网> 《国家治理》杂志> 正文

自动驾驶技术发展现状与展望

摘  要:自动驾驶作为人工智能与交通产业深度融合的标志性领域,其发展已超越单一交通工具的自动化范畴,正深度重构全球交通产业生态,引领带动全球科技竞争新趋势。近年来,自动驾驶技术取得巨大进展,已完成从实验室验证到商业化落地的关键跃迁,在垂直领域、乘用车智驾及自动驾驶出租车等核心赛道同步突破产业化瓶颈。但现阶段在安全性、成本控制、法律规范等方面,仍面临一系列难点与挑战,需建立“数据驱动技术迭代、规模降低边际成本、商业反哺数据积累”的动态循环体系,打造进阶式示范区,设立规模化运营准入许可,建立无安全员车辆合法运营机制,加快自动驾驶法律法规体系建设,实现自动驾驶从技术突破向规模化、商业化应用跃升。

关键词:自动驾驶  人工智能  技术发展  产业落地

【中图分类号】U463.6                 【文献标识码】A

2025年4月,习近平总书记在上海考察时强调:“我国数据资源丰富,产业体系完备,市场空间巨大,发展人工智能前景广阔,要加强政策支持和人才培养,努力开发更多安全可靠的优质产品。”[1]2019年,中共中央、国务院印发《交通强国建设纲要》,要求“加强智能网联汽车(智能汽车、自动驾驶、车路协同)研发,形成自主可控完整的产业链。”自动驾驶技术正以前所未有的速度突破虚实边界,成为人工智能(AI)在物理世界落地的核心载体与战略制高点。其发展已超越单一交通工具的自动化范畴,正深度重构全球交通产业生态,引领带动全球科技竞争新趋势。

从技术跃迁维度看,自动驾驶驱动人工智能实现从“虚拟智能”向“具身智能”的范式革命。以多模态大模型、端到端学习为代表的新一代AI技术,推动系统架构从“规则驱动”转向“数据驱动”演进。视觉—语言模型( VLM)、视觉—语言—动作模型(VLA)等技术的融合应用,大幅提升车辆对复杂环境的认知与决策能力,使长尾场景的泛化处理成为可能。这种对物理世界的深度理解与交互能力,使自动驾驶被公认是通向通用人工智能(AGI)的关键路径。

从产业竞合维度看,自动驾驶领域已成为全球科技大国竞逐产业制高点的重要战场。2025年,中美企业在全无人驾驶领域同步取得突破性进展:Waymo、特斯拉等美国企业持续推进规模化商业落地,Waymo在旧金山等地的全无人运营版图持续扩张;中国领军企业百度Apollo、小马智行(Pony.ai)等在北京、上海、深圳等城市实现全无人收费运营,文远知行在阿联酋、新加坡等海外市场成功开展服务。全球范围内,头部企业已在阿联酋、德国、沙特等市场展开技术验证与商业布局。当前中国在特定场景深度与商业化速度上展现优势,而全球市场规模化能力与技术标准话语权将成为下一阶段竞争焦点。

从协同创新维度看,自动驾驶作为复杂系统集成的典范,正在释放强大的产业辐射效应。其发展强力带动人工智能算法、车规级芯片、高精传感器、网联通信等产业链升级,通过多传感器融合感知、实时智能决策、安全冗余设计等关键技术突破,以及在法律法规、伦理责任等治理体系的先行探索,为低空经济、具身智能等领域提供可迁移的技术范式,加速多领域无人化技术的协同突破。

自动驾驶技术发展现状

总体发展趋势与现状

自动驾驶技术的研究,最早可追溯至20世纪70年代,经过近50年的发展,整体技术研究经历三个重要的阶段[2]。

第一阶段(20世纪70年代至20世纪末):完全基于规则的技术。早期的自动驾驶研究,主要集中于基于规则的车辆控制。1984年美国国防部高等研究计划局开展自主地面车辆项目,率先开始探索将自动驾驶应用于军用车辆的可能性。早期技术方案需要编制大量预先设置的规则集,用于决策与车辆控制,技术上限较低且可扩展性不足。

第二阶段(21世纪初至2010年代中后期):感知和数据驱动。随着传感器技术与车载硬件计算能力的提升,自动驾驶开始注重环境感知,通过部署于车端的多种传感器获取大量数据,并基于这些数据进行决策。有影响力的项目,包括谷歌无人车(后来的Waymo)、百度Apollo等。这一阶段的自动驾驶系统采用模块化设计,建模并训练多种碎片化的小模型,对地图、视觉、激光雷达数据进行信息提取与描述,并基于这些输入制定大量感知、规划、决策的规则,使得整个系统变得越来越复杂,维护和扩展难度逐步增大。

第三级阶段(2010年代晚期至今):强AI驱动的整合式系统。随着AI技术的快速发展,端到端学习、深度学习,以及近年来涌现的大模型技术开始快速被应用于自动驾驶领域。相关AI技术的引入,使自动驾驶模型具备更强的学习能力和适应性,可以基于海量的驾驶数据,学习和总结内在驾驶逻辑与规则,并据此进行决策。随着引入能力更强的AI模型与算法,原有基于规则的决策系统,可以被模型化替代,并将过去模块化无人驾驶系统整合为更精简、更智能的端到端系统。这一阶段的案例,以特斯拉的全自动驾驶系统和特斯拉无人出租车,以及百度萝卜快跑为代表。

近年来,无人驾驶技术与人工智能技术的发展,已呈现出高度耦合的趋势,AI领域前沿的图像与3D视觉建模方法,被大量引入自动驾驶的感知系统。AI领域中模仿学习、强化学习方法,被广泛用于无人驾驶规划模块或端到端决策系统。新涌现的语言、多模态大模型,也开始被快速用于新能源汽车的智能座舱,甚至被用于探索提升自动驾驶车辆在复杂环境中的常识理解及自主决策能力。目前,人工智能技术的几个主流发展方向,几乎都可以在自动驾驶系统中找到相对应的应用出口,凸显AI技术在现阶段自动驾驶技术发展中所扮演的重要角色。

前沿技术研究方向

多模态数据融合。自动驾驶汽车中普遍安装大量的感知传感器,如多个监控不同方向的高分辨率摄像头、毫米波雷达甚至激光雷达,不同类型传感器数据的结构形式、数据特征以及采样频率与延迟,都存在很大的差异。构建鲁棒和高性能的自动驾驶系统,需要有效地融合多模态的视觉及雷达点云数据,消除感知盲点,增强感知能力,以支撑更可靠的驾驶决策。现阶段自动驾驶研究领域,已探索包括前融合(传感器数据层面融合)、中融合(先进行数据特征抽取,再进行特征层面融合)和后融合(先抽取各模态相关信息,再组合利用结果信息)的三种数据融合技术。由于前融合对多模态数据处理算力及带宽要求较高,后融合存在数据信息损失问题,因此中融合已成为目前自动驾驶研究领域的主流方案。

端到端学习。自动驾驶中的端到端学习,是让基于深度神经网络的AI模型,直接从摄像头、毫米波雷达、激光雷达等设备采集的原始传感器中,学习车辆的规划与控制方式,实现从感知到决策的端到端映射。最早的端到端自动驾驶模型,可追溯至1988年卡内基梅隆大学的神经网络控制的陆地自动驾驶汽车(ALVINN)项目[3]。现阶段的端到端自动驾驶模型,普遍采用基于Transformer等现代深度学习模型架构,并基于模仿学习等AI决策优化方法,从海量驾驶数据中直接学习自动驾驶决策与控制模式。传统模块化架构,将自动驾驶任务分解为感知、预测、规划、控制等多个子任务与多个专用小模型的设计,端到端学习将驾驶任务作为一个整体任务,减少模块间融合的损失以及对大量规则的依赖,赋予系统更强的整体性能、更好的可学习性及泛化能力[4]。

世界模型。世界模型是一类能够对环境进行建模并预测未来状态的生成式AI模型。自动驾驶世界模型可通过自监督学习的方式,从大量未标注的驾驶数据中学习并提取有关物理世界的有价值信息,可用于生成多样化、真实化的驾驶场景,丰富训练数据集,提高自动驾驶系统的鲁棒性和适应性。在规划和决策方面,世界模型也可帮助模型进行更可靠的未来预测和决策推理,提高自动驾驶模型在复杂及博弈场景下的决策能力与安全性。目前,世界模型已从早期的基于图像的单模态模型,向多模态模型的方向发展,在物理世界的场景建模与生成能力方面取得巨大进展[5]。

自动驾驶VLM/VLA大模型。近年来,以视觉—语言模型(VLM)和视觉—语言—动作模型(VLA)为代表的新兴大模型,在具身智能领域内取得快速发展,并开始逐步影响自动驾驶领域。自动驾驶VLM/VLA等多模态大模型,大多基于海量的互联网级图像—文本数据进行预训练,捕捉了丰富的关于物理世界常识信息,并具备对于视觉输入中的文字、标志的认知能力,同时可借助多模态大模型本身强大的理解和推理能力,大幅提升自动驾驶模型在复杂、未知环境下的决策能力。目前普遍认为,自动驾驶VLM/VLA大模型是端到端模型之后的下一代技术路线,学术界和产业界已进行一系列积极的探索,如Waymo的EMMA自动驾驶模型[6]及国内理想汽车所提出的DriveVLM[7]、 MindVLA等模型。

车路协同。单车所具备的感知与决策能力往往有限,在满足高等级自动驾驶所要求的安全与可靠性方面,仍存在较大的挑战。因此,通过将单车智能系统与道路感知系统双向耦合,实现信息交互协同、侦测感知协同,可大大地拓展单车的感知范围与准确性。此外,通过车与车、车与路、车与人之间的网络互联化,可增强车辆、道路的协同决策能力,从而提高安全冗余及交通效率[7]。目前,车路协同自动驾驶仍需要攻克一系列关键技术,包括协同感知技术、高精度定位技术、协同决策与协同控制技术、高可靠低延时网络通信技术、云计算及安全保障技术等,但“车—路—云”一体化技术的发展,可从本质上解决单车智能自动驾驶所遇到的技术瓶颈,从而保证自动驾驶的安全性。

产业落地现状

自动驾驶技术已完成从实验室验证到商业化落地的关键跃迁,在垂直领域、乘用车智驾及自动驾驶出租车等核心赛道同步突破产业化瓶颈。

自动驾驶垂直场景商业化里程碑。自动驾驶技术在封闭/半封闭场景实现全面产业化突破,全球头部企业已验证其显著降本增效。港口自动驾驶已进入商业化规模应用阶段。1993年,世界上第一座自动化集装箱码头——鹿特丹港的ECT自动化码头正式投入商业运营,目前鹿特丹港在运营的自动驾驶引导车已有数百台。在国内,宁波舟山港已部署102辆无人集卡,昼夜无间断运行使得效率提升30%。矿业无人化已实现规模化落地应用。截至2023年底,卡特彼勒全球正在运行的无人驾驶矿用卡车超过630台,累计总运输量超过75亿吨,效率最高提升达30%。在国内,2025年5月,百台无人电动矿卡集群“华能睿驰”在内蒙古伊敏露天矿正式投入编组运营。末端配送技术正迈向规模化商业运营,并将以低成本重构即时物流成本模型。

乘用车自动驾驶分级突破新格局。全球乘用车市场,呈现“L2+规模化普及—L3法规落地突破—L4城市验证”的演进路径。L2+规模化加速渗透:盖世汽车研究院研究报告显示,2024年,国内新车L2级及以上辅助驾驶装配量达1098.2万辆,渗透率达47.9%;2025年前4个月,L2+渗透率快速突破60.94%,其中2025年4月L2++渗透率达20%,表明L2+技术正从高端车型标配向主流市场全面普及。国际L3级认证突破:2024年,中国工信部批准多家车企开展L3级自动驾驶公开道路测试。2025年,梅赛德斯—奔驰DRIVE PILOT 4.0获得欧盟首个L3认证,在德国1.3万公里高速路网允许最高95公里/时自动驾驶(需满足指定条件),标志着有条件自动驾驶技术进入落地应用新阶段。乘用车L4开启路测:继百度、小马智行、滴滴等自动驾驶出租车营运车辆开放路测后,奔驰S—Class EQS部署L4级硬件平台,成为首个获准在北京同步开展城市及高快速路L4自动驾驶测试的国际车企,标志着乘用车高阶自动驾驶测试进入新阶段。

自动驾驶出租车全球化竞争格局与运营拐点。全无人出租车运营迈入多极扩张、成本击穿、模式验证的全球竞速阶段。北美规模化发展:截至2025年5月,Waymo美国旧金山、洛杉矶、凤凰城和奥斯汀运营的自动驾驶出租车达到1500辆,每周提供超过25万次付费出行服务,并正在纽约曼哈顿开启试运营,标志着自动驾驶进入全美最复杂路网,开启全新里程碑。中国商业闭环突破:百度Apollo已于全国11个城市开放载人测试运营服务,在北京、武汉、重庆、深圳、上海开展全无人自动驾驶出行服务与测试。截至2025年5月,百度Apollo部署超1000辆无人车,全球累计提供超1100万次出行服务,安全行驶里程超过1.7亿公里。车企战略转型升级:2025年6月大众汽车推出专为自动驾驶出租车设计的全自动驾驶量产车型ID. Buzz AD,并已在美国奥斯汀,德国慕尼黑、汉堡,以及挪威奥斯陆进行实际道路测试;同月,特斯拉自动驾驶出租车在美国奥斯汀正式开启试运行,标志着车企启动战略转型。技术成本逆转临界:随着激光雷达、车载计算单元等硬件成本快速下降,自动驾驶出租车单公里成本从2019年的23.3元降至2023年的4.5元,预计2026年达2.1元,2030年降至1元,届时将击穿传统出租车1.8元成本线(弗若斯特沙利文数据),商业模式完成闭环验证。

自动驾驶技术发展面临挑战

安全性与可靠性挑战

安全性与可靠性,是自动驾驶技术所面临的重要挑战。为支撑自动驾驶技术的大规模应用,行业内形成的普遍共识是需要让自动驾驶的安全性,较人类驾驶员高出一个数量级,这对自动驾驶系统提出极高的要求。现阶段自动驾驶系统的安全性与可靠性挑战来自多方面,同时涉及耦合基础技术、系统工程及政策法规等方面。

感知系统存在可靠性瓶颈。这主要表现为多传感器数据融合过程中所面临的技术挑战,以及单车感知覆盖问题及观测盲点。提升感知系统的可靠性,不仅要求进一步研究并提升单车感知AI模型本身的鲁棒性及准确性,还需考虑在未来有效融合“车—路—云”一体化感知体系,扫除单车感知无法覆盖的盲点与死角。

复杂场景下的决策能力与泛化挑战。真实驾驶环境复杂多变,现阶段自动驾驶规划、决策系统,仍欠缺复杂场景下的高等级博弈与决策能力,在特定场景下仍可能存在应对能力不足或失效的风险。此外,现阶段自动驾驶决策AI模型所普遍采用的监督式模仿学习框架,也存在泛化能力挑战。只是对正常驾驶数据的模仿,难以学习数据分布外长尾场景及遇危状态下的驾驶行为。由于以上驾驶条件的驾驶数据高度稀缺,单纯采用模仿学习无法实现决策模型的有效泛化。新兴的AI强化学习技术对解决以上问题有一定的潜力,但目前仍存在依赖仿真环境,奖励函数设计困难,复杂多任务决策模型训练困难等一系列问题。

黑盒模型下的可解释性问题。自动驾驶技术已逐渐从原有的规则式系统,向AI模型甚至是端到端的统一系统过渡。AI模型带来能力提升的同时,其黑盒系统的不可解释性带来新的挑战。由于黑盒系统内部的决策、推理过程难以解读,对开发者在评价、识别和改进算法模型中的缺陷造成额外的障碍。由于无法清晰地理解系统的行为与意图,也给用户造成人机协作与信任难题。

闭环测试与安全验证。为充分测试自动驾驶系统性能与安全性,普遍需要进行大规模的仿真与实车上路,耗费大量的时间及资源,客观上降低自动驾驶系统的迭代研发效率。目前闭环仿真测试在环境、周车行为的拟真度及场景覆盖方面,仍存在很多缺陷,无法充分验证系统在真实环境中的性能。如何进行更充分、低成本的闭环测试与安全验证,是需要学界及产业界共同探索的重要问题。

系统复杂性与成本问题

自动驾驶系统的复杂程度,远超一般的手机和电脑等智能硬件系统。整个自动驾驶系统装备有大量的传感器,需要时刻采集数据、清洗处理数据,对周围复杂环境进行感知,并做出实时的安全决策规划。自动驾驶涉及对一系列复杂的软件、硬件、算力系统的深度集成,开发、测试与部署成本高昂。以传感器为例,目前L4级自动驾驶车辆的硬件单元一般包含6—12台摄像头,3—12台毫米波雷达、5台以内激光雷达,以及1—2台全球卫星导航系统与惯性测量单元。为满足自动驾驶AI模型的计算需求,还需装备1—2套高性能车载计算系统。即使近年来传感器及算力芯片价格不断下降,叠加所有元件的成本仍然非常高昂。这让车辆的安全性与经济实用性成为难以兼得的“鱼”和“熊掌”。

政策法规相对滞后

目前涉及自动驾驶的法律法规尚需完善。不同国家、地区对自动驾驶的定义与审批流程各异,L3级别在欧盟有严格的审批要求,在美国多州尚属灰色地带。具体到执行层面,也面临一系列伦理决策及保险与赔付机制设定难题。例如,当面对在“碰撞行人”与“撞击障碍物”之间选择时,自动驾驶系统及事后评估认定体系如何量化“最小伤害”。当前多以事后司法裁定为准,难以形成统一的实施标准。此外,若自动驾驶车辆发生事故,是由车企、自动驾驶解决方案提供商还是车主承担责任?现阶段自动驾驶事故责任认定及保险赔付机制仍处于探索阶段,难以快速推行。

自动驾驶技术发展未来展望

自动驾驶将成为物理(具身)智能领域中最重要的应用之一,有可能成为第一个通过“新图灵测试”的具身智能系统。在安全性方面,全无人驾驶安全水平将比人类驾驶至少高10倍,达到人类好司机的标准。在人性化体验方面,通过模仿学习和自主学习,自动驾驶系统将具备更自然的驾驶风格,结合乘客驾驶习惯提供更人性化的体验,最终达到人类“老司机”水平。

技术架构层面将深度整合多模态传感器数据,采用端到端训练和轻高精地图策略,提升单车智能决策能力上限。多模态融合利用机器的感知优势,通过视觉、激光雷达等多源数据全面感知环境。端到端模型将取代碎片化小模型,形成统一任务处理框架。轻高精地图模式降低对高精地图的依赖,将地图作为数据源输入,依靠实时感知与决策实现精确定位,大幅提升自动驾驶系统的单车智能决策能力。

大模型和生成式AI,将在提升L4级别自动驾驶系统的泛化能力方面,发挥关键作用。针对自动驾驶边缘场景数据不足的问题,大模型生成式AI可结合真实数据,生成高质量边缘场景数据,覆盖更广泛、更复杂的罕见情况,如极端天气下的特殊物体识别、非标准交通参与者的行为模拟以及复杂路口的多方交互等,填补场景仿真与模拟的不足,有效解决感知领域的长尾挑战。借助大模型的推理能力,自动驾驶系统可理解并应对道路突发情况,进一步提升能力上限。

系统架构将以单车智能为核心,通过“车—路—云”协同机制,保障安全冗余并提升交通效率。自动驾驶车辆必须独立具备智能驾驶能力,形成基础操作保障。“车—路—云”一体化提供多重安全冗余机制,保障驾驶安全。同时通过全局决策优化交通流量,有效提升道路资源利用效率,推动智能交通系统升级。

加快自动驾驶技术创新发展的对策建议

构建数据—规模—商业的自我强化闭环。建立“数据驱动技术迭代、规模降低边际成本、商业反哺数据积累”的动态循环体系。构建行业—科研机构数据开放共享机制,整合极端工况、长尾场景等关键数据资源,形成跨企业数据/算力共享机制,推动行业—科研机构良性合作,实现“真实场景数据—算法优化—商业收益—数据反哺”的正向循环。

打造进阶式示范区与产业规模化政策矩阵。推动示范区从单点测试(<50km2)向城市群联网(>500km2)升级,构建广域协同的“车路云一体化”基础设施,支持跨域连续性服务验证。加速商业化场景开放,在自动驾驶、干线物流、城市微循环等领域设立规模化运营准入许可,推动成熟技术落地应用。建立无安全员车辆合法运营机制,构建自动驾驶安全测试、系统可靠性评价等国家标准,为规模化落地提供有力保障。

加快自动驾驶法律法规体系建设。当前政策法规在责任界定、保险覆盖、安全验证等领域尚未形成系统性框架,亟须突破三大关键矛盾:技术快速迭代与法规滞后性冲突、商业化需求与现行监管不适配,以及全球化竞争与本地规则不协同。为此,要优先解决自动驾驶路权保障问题,确立自动驾驶系统最小伤害伦理评估原则,制定交通事故责任分级认定标准及赔付规则,创新动态车险精算模型与专属保险产品体系,同步构建司法裁判与执行保障机制,以法治创新突破加速产业合规化、规模化发展。

【本文作者为中国工程院外籍院士,清华大学智能科学讲席教授、智能产业研究院院长】

注释略

责编:程静静/美编:石 玉

责任编辑:孟雨非