典型文献
考虑框架协议的动态报童模型强化学习建模研究
文献摘要:
企业为了稳定货源和供货关系,常与供应商签订一定时期的框架性协议.为了解决零售商在框架协议下采购报童产品的问题,本文运用强化学习建立库存决策模型并使用Q学习算法求取较优订货策略.通过生成样本随机数来模拟需求量,对比研究Q学习算法订货和传统方法订货的差别.通过多次数值实验,发现使用强化学习方法订货相比于传统订货方法(定量订货法、移动平均预测、指数平滑法)平均利润提高约7%~22%,且多次实验下强化学习方法订货相比于理想状态的平均利润相差约8%.这些发现验证了强化学习解决库存问题的有效性和可行性.本文还研究了相关参数变化对总利润的影响,发现利润随着贪婪率(e)增加而降低、随着学习率(α)的增加而增加.该结论能够为解决相关库存问题提供新的思路.
文献关键词:
库存模型;框架协议;Q学习算法
中图分类号:
作者姓名:
祁玉青;赵兴雷;赵田东杰
作者机构:
南京工业大学经济与管理学院,江苏南京211816
文献出处:
引用格式:
[1]祁玉青;赵兴雷;赵田东杰-.考虑框架协议的动态报童模型强化学习建模研究)[J].运筹与管理,2022(10):105-112
A类:
B类:
框架协议,报童模型,建模研究,定货,货源,供货,供应商,签订,零售商,库存决策,决策模型,求取,订货策略,数值实验,强化学习方法,移动平均,指数平滑法,平均利润,参数变化,贪婪,学习率,库存模型
AB值:
0.357807
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。