基于分层强化学习和社会偏好的自主超车决策系统|吕超;鲁洪良;于洋;王昊阳;吴绍斌 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于分层强化学习和社会偏好的自主超车决策系统

文献摘要：

针对超车过程中主车和被超越车之间的交互行为,引入心理学中的"社会偏好"来描述被超越车辆的纵向行为特征,并通过数据驱动的分类方法,提取社会偏好并将其融合在基于强化学习的自主超车决策系统设计中,通过分析大量真实超车数据中被超越车辆的社会偏好,认为该方法能够根据不同偏好情况产生合理的决策指令.首先,从大量真实超车数据中计算超车交互过程中被超越车辆的状态转移概率,并将其分成了 3类(利他型、利己型和互惠型),并设计一种半基于模型改进的Q-learning算法,将3种社会偏好的概率考虑在决策模型训练中;然后,搭建实时的社会偏好分类器用于对被超越车辆社会偏好的实时分类;再结合换道控制器的研究结果,组合构建完整的分层强化学习自主超车系统;最后,通过实车采集数据与仿真环境进行了自主超车的联合验证.研究结果表明:考虑了社会偏好的自主超车决策系统能够对被超越车辆的社会偏好进行实时预测,进而在更加复杂的超车情况中做出合理的决策;相比于不考虑社会偏好的传统自主超车系统,构建的自主超车系统展现了更好的舒适性和稳定性.研究结果创新性地将数据驱动的社会偏好作用于超车决策过程,提升了决策的自适应性和合理性,将有助于发展安全可靠的自主超车系统.

文献关键词：

汽车工程;自主超车决策系统;分层强化学习;先进驾驶人辅助系统;社会偏好;半基于模型的 Q-learning

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[2] 文化、科学、教育、体育（G） / 教育（G4） / 教学理论（G42） / 教学研究和改革（G420）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机软件（TP31） / 程序设计、软件工程（TP311）

作者姓名：

吕超;鲁洪良;于洋;王昊阳;吴绍斌

作者机构：

北京理工大学机械与车辆学院,北京 100081

文献出处：

中国公路学报

引用格式：

[1]吕超;鲁洪良;于洋;王昊阳;吴绍斌-.基于分层强化学习和社会偏好的自主超车决策系统)[J].中国公路学报,2022(03):115-126

A类：

自主超车决策系统,先进驾驶人辅助系统

B类：

分层强化学习,社会偏好,交互行为,入心,行为特征,分类方法,中计,状态转移概率,利他,利己,互惠,基于模型,模型改进,learning,决策模型,模型训练,分类器,器用,实时分类,换道控制,车系,采集数据,仿真环境,实时预测,舒适性,决策过程,自适应性,发展安全,汽车工程

AB值：

0.230752

相似文献

基于场景动力学和强化学习的自动驾驶边缘测试场景生成方法

李江坤;邓伟文;任秉韬;王文奇;丁娟-北京航空航天大学交通科学与工程学院,北京 100191;浙江天行健智能科技有限公司,嘉兴 314000

基于驾驶行为生成机制的智能汽车类人行为决策

宋东鉴;朱冰;赵健;韩嘉懿;刘彦辰-吉林大学,汽车仿真与控制国家重点实验室,长春 130022

面向自动驾驶汽车测试的交通车辆交互过程建模

蒋渊德;朱冰;赵祥模;赵健;郑兵兵-长安大学信息工程学院,西安 710018;吉林大学,汽车仿真与控制国家重点实验室,长春 130025;中航光电科技股份有限公司,洛阳 471000

基于热力耦合的沥青路面Top-down裂缝影响因素研究

杨三强;廖松洋;郭猛;何伟;蔡永利-河北省土木工程监测与评估技术创新中心河北大学建筑工程学院,河北保定 071002;长安大学公路学院,陕西西安710000;北京工业大学,建筑工程学院,北京 100000;中电建冀交高速公路投资发展有限公司,河北石家庄 050000

基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

杨璐;王一权;刘佳琦;段玉林;张荣辉-天津理工大学天津市先进机电系统设计与智能控制重点实验室天津300384;天津理工大学机电工程国家级实验教学示范中心天津300384;中国农业科学院农业资源与农业区划研究所北京100081;中山大学广东省智能交通系统重点实验室广州510275

车辆碰撞预警系统对行车风险的干预效果

许甜;高健强;刘建蓓;赵超杰;刘国图-中交第一公路勘察设计研究院有限公司西安710065;同济大学交通运输工程学院上海200092

山区公路小半径弯道路段事故严重度影响因素及其异质性比较分析

赵华祥;杜飞翔;付开华;苏宇;杨文臣-云南省交通规划设计研究院有限公司陆地交通气象灾害防治技术国家工程实验室昆明 650200;云南省交通投资建设集团有限公司昭通管理处昆明 657099

基于双延迟深度确定性策略梯度的船舶自主避碰方法

刘钊;周壮壮;张明阳;刘敬贤-武汉理工大学航运学院武汉 430063;武汉理工大学内河航运技术湖北省重点实验室武汉 430063;武汉理工大学国家水运安全工程技术研究中心武汉 430063;阿尔托大学工程学院机械工程系芬兰艾斯堡 20110

基于触觉引导的L2级智能汽车人机共享控制技术综述

邓修金;王艳阳;黄秋实;王珂;廖凯凯-西华大学汽车测控与安全四川省重点实验室成都 610039;西华大学流体及动力机械教育部重点实验室成都 610039;四川省新能源汽车智能控制与仿真测试技术工程研究中心成都 610039

自动驾驶影响下的出行行为研究综述

李瑞敏;戴晶辰-清华大学土木工程系,北京 100084

基于强化学习的智能车人机共融转向驾驶决策方法

吴超仲;冷姚;陈志军;罗鹏-武汉理工大学智能交通系统研究中心,湖北武汉 430063;武汉理工大学交通与物流工程学院,湖北武汉 430063;武汉理工大学计算机与人工智能学院,湖北武汉 430063

基于策略记忆的深度强化学习序列推荐算法研究

陈卓;姜伟豪;杜军威-青岛科技大学信息科学技术学院,山东青岛266061

城市道路超车特征分析与高风险超车识别

李君羡;王浩;沈宙彪;吴志周-同济大学道路与交通工程教育部重点实验室,上海201804;上海应用技术大学计算机科学与信息工程学院,上海200235;上海市城市建设设计研究总院(集团)有限公司,上海200125

货车移动遮断影响下的跟驰风险异质性建模

谢世坤;杨轸;戢晓峰-同济大学道路与交通工程教育部重点实验室,上海201804;昆明理工大学交通工程学院,云南昆明650500

基于前景理论的换道决策模型研究

顾金刚;蒲科辰;杨达;吕蒙;朱自博-公安部交通管理科学研究所交通控制技术研究部,江苏无锡214151;西南交通大学交通运输与物流学院,四川成都610031

基于改进人工势场法的智能汽车轨迹规划算法研究

赵奉奎;葛振;董锋威;张涌-南京林业大学汽车与交通工程学院,江苏南京210037

高速公路改扩建应急车道综合利用仿真研究

陈雅楠;李美玲;李广惠;冉晋-山东建筑大学山东高校重点实验室道路与交通工程实验室济南 250101;山东建筑大学土木工程学院济南 250101;山东省交通科学研究院济南 250102

内河无人船的驾驶行为决策模型

杨娇;张庆年;杨杰;阮军;吴绩伟;凌强-武汉理工大学交通与物流工程学院武汉 430063;武汉理工大学信息工程学院武汉 430070;上海国际港务(集团)股份有限公司上海 200135

面向HMI的智能网联车信任度研究

郑凯淘;万雨杰;唐大琳;孙子云;夏晶-武汉理工大学交通与物流工程学院武汉 430063

驾驶人意图识别综述

付锐;张海伦;刘文晓;张洪加-长安大学汽车学院,陕西西安710064;长安大学汽车运输安全保障技术交通行业重点实验室,陕西西安710064

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。