典型文献
基于深度强化学习的智联网汽车感知任务分配
文献摘要:
随着智能/辅助/自动驾驶以及电动汽车技术的飞速发展,当前智联网汽车配备越来越多的传感器,拥有越来越强大的计算、存储和通信能力.作为智联网汽车中重要一类,出租车、滴滴等网约车(Mobility-on-demand vehicles)具有城市覆盖规模大和粒度细,以及空闲时间充足的优点.因此,利用这些智联网汽车现有的移动感知设备能够为城市大规模、细粒度、低成本的感知提供很好的机会.本文以出租车、滴滴等这一类重要的智联网汽车为研究对象,重点研究它们的感知任务分配问题,主要面临两方面挑战:一是智联网汽车载客收益(如出租车载客收入)以及汽车/感知任务分布具有时空动态性,导致智联网汽车的感知成本具有高时空动态性且很难建模和学习.二是感知任务的最优分配问题是NP-hard问题,具有指数级时间复杂度.同时,高移动性的智联网汽车对任务的实时分配要求很高.因此,如何对大规模的智联网汽车实现任务的最优实时分配具有挑战性.为了解决这两个挑战,本文提出基于深度强化学习的智联网汽车感知任务分配方法.通过深度强化学习模型对高时空动态性的汽车感知成本进行精确学习,然后基于学习结果进行感知任务的实时最优分配.具体地,针对挑战一,利用基于双注意力机制的循环神经网络挖掘汽车载客收益的时空相关性,并结合驾驶耗费模型,学习智联网汽车的感知成本.针对挑战二,首先通过问题等价转换和理论分析,证明该任务的最优分配问题具有单调子模目标函数和q-独立系统约束条件.然后,基于子模优化理论,联合考虑整体收益和边际效益,提出多项式时间复杂度的近似最优分配算法(近似率为1/「2+Cmax/Cmin]),其中Cmax和Cmin分别表示所有感知成本的最大和最小值.最后,基于两个大规模的智联网汽车数据集(重庆市,约12493辆车;纽约市,约超过1.13亿个行程),对所提方法进行深入全面的评估.实验结果表明,所提方法比7种对比方法平均提高载客收益的预测精度25.1%,提高任务分配的总感知效益37.7%.同时,面向城市道路违规停车监测应用,构建智联网汽车感知原型系统.基于该系统验证了所提方法的可行性和实际应用价值.
文献关键词:
智联网汽车;感知任务分配;深度强化学习;子模优化;循环神经网络
中图分类号:
作者姓名:
向朝参;李耀宇;冯亮;陈超;郭松涛;杨盘隆
作者机构:
重庆大学计算机学院 重庆 400044;信息物理社会可信服务计算教育部重点实验室 重庆 400044;中国科学技术大学计算机科学与技术学院 合肥 230026
文献出处:
引用格式:
[1]向朝参;李耀宇;冯亮;陈超;郭松涛;杨盘隆-.基于深度强化学习的智联网汽车感知任务分配)[J].计算机学报,2022(05):918-934
A类:
智联网汽车,子模优化,2+Cmax,汽车数据集
B类:
深度强化学习,感知任务分配,自动驾驶,电动汽车技术,出租车,滴滴,网约车,Mobility,on,demand,vehicles,粒度细,空闲,闲时,移动感知,城市大规模,细粒度,分配问题,车载,载客,时空动态性,感知成本,NP,hard,数级,时间复杂度,移动性,现任,分配方法,学习结果,双注意力机制,循环神经网络,网络挖掘,时空相关性,耗费,等价转换,调子,独立系统,优化理论,边际效益,多项式时间,分配算法,Cmin,有感,最小值,辆车,纽约市,亿个,比方,城市道路,违规,停车,监测应用,原型系统,系统验证
AB值:
0.247001
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。