首站-论文投稿智能助手
典型文献
深度强化学习结合图注意力模型求解TSP问题
文献摘要:
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100-TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法.
文献关键词:
深度强化学习;旅行商问题;图注意力模型;图神经网络;组合最优化
作者姓名:
王扬;陈智斌;杨笑笑;吴兆蕊
作者机构:
昆明理工大学理学院,昆明,650000
引用格式:
[1]王扬;陈智斌;杨笑笑;吴兆蕊-.深度强化学习结合图注意力模型求解TSP问题)[J].南京大学学报(自然科学版),2022(03):420-429
A类:
图注意力模型,REINFORCE
B类:
深度强化学习,模型求解,TSP,旅行商问题,Traveling,Salesman,Problem,组合最优化问题,Combinatorial,Optimization,COP,经典问题,反复研究,Deep,Reinforcement,Learning,DRL,无人驾驶,工业自动化,路径长,网络参数,小方,局部最优,在编,编码结构,位置编码,Positional,Encoding,PE,平移不变性,增强模型,图神经网络,Graph,Neural,Network,GNN,Transformer,处理应用,解码,拓扑结构,潜在关系,优化效果,传统算法
AB值:
0.425273
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。