典型文献
基于Q—学习的超启发式模型及算法求解多模式资源约束项目调度问题
文献摘要:
为了更好地解决传统的元启发式算法机制单一和面向问题定制不足等问题,提高算法的整体通用性,本文提出一种基于Q—学习的超启发式模型,并基于该模型设计实现了一种超启发式算法,求解多模式资源约束项目调度问题(MRCPSP).该模型架构分为高低两层,低层由具有多种异构机制和不同参数的元启发式算子组成,高层则依据Q—学习策略自动选择低层算子.模型将多种优秀的元启发式算法与反馈—学习强化机制有机整合,具备灵活的可扩展性.为检验算法效果,从MRCPSP标杆算例库中选取了上千个规模不等的算例,设计了等价比较实验环节,并与最新公开文献提供的结果进行了比较.结果表明,基于Q—学习的超启发式算法在目标值、通用性、鲁棒性等多项性能指标上均表现优异,可以借鉴应用到其他各种组合优化问题.值得一提的是,针对J30算例的计算结果有多达41个算例获得了比当前公开文献报告的已知最优解更好的结果.
文献关键词:
超启发式模型;强化学习;Q—学习;多模式资源约束项目调度问题;元启发式算法;反馈—学习强化机制
中图分类号:
作者姓名:
崔建双;吕玥;徐子涵
作者机构:
北京科技大学 经济管理学院,北京 100083
文献出处:
引用格式:
[1]崔建双;吕玥;徐子涵-.基于Q—学习的超启发式模型及算法求解多模式资源约束项目调度问题)[J].计算机集成制造系统,2022(05):1472-1481
A类:
超启发式模型,多模式资源约束项目调度问题,资源约束项目调度问题,MRCPSP
B类:
元启发式算法,算法机制,制单,通用性,模型设计,设计实现,超启发式算法,模型架构,两层,低层,同参数,子组,学习策略,强化机制,有机整合,可扩展性,验算,标杆,上千,千个,等价,比较实验,实验环节,目标值,多项性能指标,组合优化问题,值得一提的是,J30,多达,最优解,强化学习
AB值:
0.221302
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。