典型文献
基于不确定需求的无人驾驶出租车优化调度
文献摘要:
为了减少乘客在高峰期打车难和出租车空载的情况,面对不确定的出行需求,提出一个无模型深度强化学习框架,以解决无人驾驶出租车调度问题.该框架使用马尔可夫决策模型进行建模,综合考虑了运营商收益与顾客等待成本,使用基于策略的深度强化学习算法——双延迟深度确定性策略梯度算法(TD3)对无人驾驶出租车进行调度,达到合理分配空闲车辆资源的目的.基于纽约市的真实出租车出行数据搭建了环境模拟器,通过在训练过程中加入不确定需求来增强算法鲁棒性.实验结果证明了该方法在求解不确定需求下的无人驾驶出租车调度问题时的有效性.
文献关键词:
强化学习;无人驾驶出租车;车辆调度;策略梯度
中图分类号:
作者姓名:
周晓婷;吴禄彬;章宇;姜善成
作者机构:
中山大学 智能工程学院,广东 深圳 518107;西南财经大学 工商管理学院,四川 成都 611130
文献出处:
引用格式:
[1]周晓婷;吴禄彬;章宇;姜善成-.基于不确定需求的无人驾驶出租车优化调度)[J].计算机集成制造系统,2022(11):3433-3442
A类:
无人驾驶出租车
B类:
不确定需求,优化调度,乘客,高峰期,打车,空载,出行需求,无模型,模型深度,决无,调度问题,马尔可夫决策,决策模型,运营商,顾客,深度强化学习算法,双延迟深度确定性策略梯度算法,TD3,合理分配,空闲,纽约市,环境模拟,模拟器,训练过程,增强算法,车辆调度
AB值:
0.231957
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。