基于模仿学习的自动驾驶智能体构建|杨瑞阳;金蓓弘|中国科学院大学,北京 100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于模仿学习的自动驾驶智能体构建

文献摘要：

模仿学习是智能体从专家轨迹数据中学习获得尽可能靠近专家策略决策的智能学习方法.近年来,模仿学习已从早期的行为克隆发展到了逆强化学习、生成对抗模仿学习,以及多智能体模仿学习.而目前自动驾驶技术中传感器获取外界信息的能力与深度学习实现的感知环境能力都日趋完善,在决策部分,依靠基于规则的模型可应对大部分常见驾驶场景,但针对规则模型中不适用的极端场景,如何智能化实现安全决策,仍是当前研究的热点问题.本文综述了模仿学习在自动驾驶领域的代表性工作,详细讨论了它们的优势与不足并指出了它们未来的发展趋势.

文献关键词：

模仿学习;生成对抗模仿学习;多智能体模仿学习;自动驾驶

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[2] 自动化技术、计算机技术（TP） / 自动化技术及设备（TP2） / 自动化系统（TP27） / 自动控制、自动控制系统（TP273）

[3] 交通运输（U） / 公路运输（U4） / 交通工程与公路运输技术管理（U49） / 交通工程与交通管理（U491）

作者姓名：

杨瑞阳;金蓓弘

作者机构：

中国科学院软件研究所,北京 100190;中国科学院大学,北京 100049

文献出处：

引用格式：

[1]杨瑞阳;金蓓弘-.基于模仿学习的自动驾驶智能体构建)[J].人工智能,2022(04):30-39

A类：

生成对抗模仿学习,多智能体模仿学习

B类：

轨迹数据,专家策略,策略决策,智能学习,从早,行为克隆,逆强化学习,自动驾驶技术,日趋完善,基于规则,驾驶场景,极端场景,智能化实现,安全决策,优势与不足

AB值：

0.261629

相似文献

专家监督的SAC强化学习重载列车运行优化控制

杨辉;王禹;李中奇;付雅婷;谭畅-华东交通大学电气与自动化工程学院,江西南昌330013;江西省先进控制与优化重点实验室,江西南昌330013

多智能体专家型策略梯度的目标跟踪与清障

孙辉辉;胡春鹤;张军国-北京林业大学工学院,北京100083;华北科技学院机电工程学院,河北廊坊065201

基于多智能体强化学习的乳腺癌致病基因预测

刘健;顾扬;程玉虎;王雪松-地下空间智能控制教育部工程研究中心徐州221116;中国矿业大学信息与控制工程学院徐州221116

基于逆向强化学习的纵向自动驾驶决策方法

高振海;闫相同;高菲-吉林大学,汽车仿真与控制国家重点实验室,长春 130022

基于场景动力学和强化学习的自动驾驶边缘测试场景生成方法

李江坤;邓伟文;任秉韬;王文奇;丁娟-北京航空航天大学交通科学与工程学院,北京 100191;浙江天行健智能科技有限公司,嘉兴 314000

面向自动驾驶汽车测试的交通车辆交互过程建模

蒋渊德;朱冰;赵祥模;赵健;郑兵兵-长安大学信息工程学院,西安 710018;吉林大学,汽车仿真与控制国家重点实验室,长春 130025;中航光电科技股份有限公司,洛阳 471000

机器人运动轨迹的模仿学习综述

黄艳龙;徐德;谭民-英国利兹大学计算机系利兹 LS29JT 英国;中国科学院自动化研究所精密感知与控制研究中心北京 100190中国;中国科学院大学人工智能学院北京 101408中国;中国科学院自动化研究所复杂系统管理与控制国家重点实验室北京 100190中国

车路协同条件下智能网联汽车一体化决策模型

熊明强;胡文力;谯杰;夏芹;张强;江萌-汽车噪声振动和安全技术国家重点实验室,重庆 401122;中国汽车工程研究院股份有限公司,重庆 401122;中国市政工程西南设计研究总院有限公司,成都 610084

自动驾驶中的时间维度与体感舒适度

大方-轻舟智航联合

基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

杨璐;王一权;刘佳琦;段玉林;张荣辉-天津理工大学天津市先进机电系统设计与智能控制重点实验室天津300384;天津理工大学机电工程国家级实验教学示范中心天津300384;中国农业科学院农业资源与农业区划研究所北京100081;中山大学广东省智能交通系统重点实验室广州510275

人机混驾交通流交织区换道模型切换控制策略

李霞;李明烨;张孝铭;崔洪军;马新卫-河北工业大学土木与交通学院天津 300401;帝国理工大学商学院伦敦 SW72AZ

不同级别的自动驾驶未来将长期共存?

基于D-S证据理论的多传感器融合感知系统设计

朱珩-苏州智加科技有限公司江苏苏州 215100

自动驾驶系统交通规则符合性仿真验证方法

王长君;胡伟超;于鹏程;周文辉;宋思达-公安部道路交通安全研究中心,北京 100062;北京工业大学城市交通学院,北京 100124;华为技术有限公司,北京 100095

车联网环境下自动驾驶车辆车道选择决策模型

杨达;吕蒙;戴力源;王啸文;郭茜-西南交通大学交通运输与物流学院,四川成都 610031;西南交通大学综合交通运输智能化国家地方联合工程实验室,四川成都 610031;西南交通大学综合交通大数据应用技术国家工程实验室,四川成都 610031

TE Connectivity:以创新为内驱,引领新能源赛道专访TE Connectivity汽车事业部中国区副总裁兼总经理孙晓光

基于车联网的多车协同式自动驾驶控制研究

黄露;姚丽;杨易-长沙智能驾驶研究院湖南省长沙市 410100

基于专利引用和文本信息的自动驾驶技术演化

陈力;肖晨剑;常旭华-同济大学汽车学院,上海201804;上海市地面交通工具风洞专业技术服务平台,上海201804;同济大学上海国际知识产权学院,上海200093

机器人自动轴孔装配研究进展

徐德;秦方博-中国科学院自动化研究所,北京 100190

地铁列车驾驶技术发展综述:从人工驾驶到智能无人驾驶

赖文柱;陈德旺;何振峰;邓新国;GIUSEPPE CARLO Marano-福州大学计算机与大数据学院,福建福州 350108;福州大学智慧地铁福建省高校重点实验室,福建福州 350108;福建工程学院交通运输学院,福建福州 350118;都灵理工大学,意大利都灵 EI10129

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。