基于深度强化学习的智联网汽车感知任务分配|向朝参;李耀宇;冯亮;陈超;郭松涛;杨盘隆|信息物理社会可信服务计算教育部重点实验室重庆 400044 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于深度强化学习的智联网汽车感知任务分配

文献摘要：

随着智能/辅助/自动驾驶以及电动汽车技术的飞速发展,当前智联网汽车配备越来越多的传感器,拥有越来越强大的计算、存储和通信能力.作为智联网汽车中重要一类,出租车、滴滴等网约车(Mobility-on-demand vehicles)具有城市覆盖规模大和粒度细,以及空闲时间充足的优点.因此,利用这些智联网汽车现有的移动感知设备能够为城市大规模、细粒度、低成本的感知提供很好的机会.本文以出租车、滴滴等这一类重要的智联网汽车为研究对象,重点研究它们的感知任务分配问题,主要面临两方面挑战:一是智联网汽车载客收益(如出租车载客收入)以及汽车/感知任务分布具有时空动态性,导致智联网汽车的感知成本具有高时空动态性且很难建模和学习.二是感知任务的最优分配问题是NP-hard问题,具有指数级时间复杂度.同时,高移动性的智联网汽车对任务的实时分配要求很高.因此,如何对大规模的智联网汽车实现任务的最优实时分配具有挑战性.为了解决这两个挑战,本文提出基于深度强化学习的智联网汽车感知任务分配方法.通过深度强化学习模型对高时空动态性的汽车感知成本进行精确学习,然后基于学习结果进行感知任务的实时最优分配.具体地,针对挑战一,利用基于双注意力机制的循环神经网络挖掘汽车载客收益的时空相关性,并结合驾驶耗费模型,学习智联网汽车的感知成本.针对挑战二,首先通过问题等价转换和理论分析,证明该任务的最优分配问题具有单调子模目标函数和q-独立系统约束条件.然后,基于子模优化理论,联合考虑整体收益和边际效益,提出多项式时间复杂度的近似最优分配算法(近似率为1/「2+Cmax/Cmin]),其中Cmax和Cmin分别表示所有感知成本的最大和最小值.最后,基于两个大规模的智联网汽车数据集(重庆市,约12493辆车;纽约市,约超过1.13亿个行程),对所提方法进行深入全面的评估.实验结果表明,所提方法比7种对比方法平均提高载客收益的预测精度25.1％,提高任务分配的总感知效益37.7％.同时,面向城市道路违规停车监测应用,构建智联网汽车感知原型系统.基于该系统验证了所提方法的可行性和实际应用价值.

文献关键词：

智联网汽车;感知任务分配;深度强化学习;子模优化;循环神经网络

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机软件（TP31） / 程序设计、软件工程（TP311）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

向朝参;李耀宇;冯亮;陈超;郭松涛;杨盘隆

作者机构：

重庆大学计算机学院重庆 400044;信息物理社会可信服务计算教育部重点实验室重庆 400044;中国科学技术大学计算机科学与技术学院合肥 230026

文献出处：

计算机学报

引用格式：

[1]向朝参;李耀宇;冯亮;陈超;郭松涛;杨盘隆-.基于深度强化学习的智联网汽车感知任务分配)[J].计算机学报,2022(05):918-934

A类：

智联网汽车,子模优化,2+Cmax,汽车数据集

B类：

深度强化学习,感知任务分配,自动驾驶,电动汽车技术,出租车,滴滴,网约车,Mobility,on,demand,vehicles,粒度细,空闲,闲时,移动感知,城市大规模,细粒度,分配问题,车载,载客,时空动态性,感知成本,NP,hard,数级,时间复杂度,移动性,现任,分配方法,学习结果,双注意力机制,循环神经网络,网络挖掘,时空相关性,耗费,等价转换,调子,独立系统,优化理论,边际效益,多项式时间,分配算法,Cmin,有感,最小值,辆车,纽约市,亿个,比方,城市道路,违规,停车,监测应用,原型系统,系统验证

AB值：

0.247001

相似文献

面向智能任务的语义通信:理论、技术和挑战

刘传宏;郭彩丽;杨洋;陈九九;朱美逸;孙鲁楠-北京邮电大学先进信息网络北京实验室,北京 100876;北京邮电大学网络体系构建与融合北京市重点实验室,北京 100876

面向调控信息新鲜度保障的电力至简物联网资源优化

廖海君;贾泽晗;周振宇;刘念;王飞;甘忠;姚贤炯-华北电力大学河北省电力物联网技术重点实验室,河北保定 071003;国网上海市电力公司电力调度控制中心,上海 200122

基于深度强化学习的网约车动态路径规划

郑渤龙;明岭峰;胡琦;方一向;郑凯;李国徽-华中科技大学计算机科学与技术学院武汉 430074;香港中文大学(深圳)数据科学学院广东深圳 518172;电子科技大学计算机科学与工程学院成都 610054

基于用户关注度以及时间监督的任务分发

张力;张书奎;刘海;张洋;陶冶;龙浩;于淳清;祝启鼎-苏州大学计算机科学与技术学院江苏苏州 215006;淮北师范大学计算机科学与技术学院安徽淮北 235099

区块链群智感知中基于隐私数据真值估计的激励机制