典型文献
内河无人船的驾驶行为决策模型
文献摘要:
基于船舶领域的《内河避碰规则》,以交互学习、积累决策经验为手段,建立基于TD3(twin-delayed deep deterministic policy gradient)算法的驾驶行为决策模型.模型设置安全性、经济性及协调性三类奖励函数,并通过奖励值的不断迭代,使模型快速收敛.并基于此模型,对内河中常见的对驶、交叉相遇及追越三种会遇场景进行仿真试验.结果表明:与DDPG相比,TD3算法不仅缩短了模型训练时间,还提升了决策效果.对比分析不同船长、航速下的驾驶行为决策结果,发现此模型不仅可以安全快速地进行自主驾驶决策,而且可对避碰路径进行优化,得到无人船较佳的自主驾驶决策方案.
文献关键词:
交通运输工程;航运安全;深度强化学习;TD3;内河无人驾驶船舶;驾驶行为决策
中图分类号:
作者姓名:
杨娇;张庆年;杨杰;阮军;吴绩伟;凌强
作者机构:
武汉理工大学交通与物流工程学院 武汉 430063;武汉理工大学信息工程学院 武汉 430070;上海国际港务(集团)股份有限公司 上海 200135
文献出处:
引用格式:
[1]杨娇;张庆年;杨杰;阮军;吴绩伟;凌强-.内河无人船的驾驶行为决策模型)[J].武汉理工大学学报(交通科学与工程版),2022(03):552-558
A类:
内河无人驾驶船舶
B类:
无人船,驾驶行为决策,决策模型,船舶领域,避碰规则,交互学习,TD3,twin,delayed,deep,deterministic,policy,gradient,奖励函数,过奖,奖励值,快速收敛,河中,相遇,会遇,仿真试验,DDPG,模型训练,训练时间,决策效果,同船,船长,航速,安全快速,较佳,交通运输工程,航运安全,深度强化学习
AB值:
0.416349
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。