首站-论文投稿智能助手
典型文献
随机需求车辆路径问题的价值逼近在线决策
文献摘要:
随着高效实时物流的发展,不确定车辆路径问题面临着兼顾决策精度和实时响应能力的新挑战.本文以应用最为广泛的随机需求车辆路径问题为例,研究提出一种有效的在线决策方法.首先,考虑多车辆同时在线,以总旅行成本最小化为目标,建立马尔科夫决策模型,并引入可信度约束和邻域半径减少策略缩小行动空间,提高求解效率.其次,设计强化学习中的价值逼近算法求解模型,其中,采用基函数估计期望未来成本,并将求解过程分离为离线训练和在线决策两个环节,基函数的权重被离线训练并用于在线决策以减少在线决策时间,同时,在算法中嵌入了邻域半径的动态更新机制.最后,测试多组算例验证了本文方法的有效性.
文献关键词:
路径问题;随机需求;马尔可夫决策;强化学习;价值逼近算法
作者姓名:
张晓楠;张建雄
作者机构:
天津大学管理与经济学部,天津300072;陕西科技大学机电工程学院,陕西西安710021
文献出处:
引用格式:
[1]张晓楠;张建雄-.随机需求车辆路径问题的价值逼近在线决策)[J].控制理论与应用,2022(02):241-254
A类:
在线决策方法,减少策略,价值逼近算法
B类:
随机需求,车辆路径问题,近在,实时响应,响应能力,同时在线,旅行成本,成本最小化,立马,马尔科夫决策模型,可信度,邻域半径,求解效率,强化学习,解模,基函数,离线训练,决策时间,动态更新,更新机制,算例验证,马尔可夫决策
AB值:
0.268458
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。