考虑框架协议的动态报童模型强化学习建模研究|祁玉青;赵兴雷;赵田东杰 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

考虑框架协议的动态报童模型强化学习建模研究

文献摘要：

企业为了稳定货源和供货关系,常与供应商签订一定时期的框架性协议.为了解决零售商在框架协议下采购报童产品的问题,本文运用强化学习建立库存决策模型并使用Q学习算法求取较优订货策略.通过生成样本随机数来模拟需求量,对比研究Q学习算法订货和传统方法订货的差别.通过多次数值实验,发现使用强化学习方法订货相比于传统订货方法(定量订货法、移动平均预测、指数平滑法)平均利润提高约7％～22％,且多次实验下强化学习方法订货相比于理想状态的平均利润相差约8％.这些发现验证了强化学习解决库存问题的有效性和可行性.本文还研究了相关参数变化对总利润的影响,发现利润随着贪婪率(e)增加而降低、随着学习率(α)的增加而增加.该结论能够为解决相关库存问题提供新的思路.

文献关键词：

库存模型;框架协议;Q学习算法

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

[3] 文化、科学、教育、体育（G） / 教育（G4） / 教学理论（G42） / 教学研究和改革（G420）

作者姓名：

祁玉青;赵兴雷;赵田东杰

作者机构：

南京工业大学经济与管理学院,江苏南京211816

文献出处：

运筹与管理

引用格式：

[1]祁玉青;赵兴雷;赵田东杰-.考虑框架协议的动态报童模型强化学习建模研究)[J].运筹与管理,2022(10):105-112

A类：

B类：

框架协议,报童模型,建模研究,定货,货源,供货,供应商,签订,零售商,库存决策,决策模型,求取,订货策略,数值实验,强化学习方法,移动平均,指数平滑法,平均利润,参数变化,贪婪,学习率,库存模型

AB值：

0.357807

相似文献

仅知需求区间信息下具有二次订货机会的损失厌恶报童鲁棒优化模型

邱若臻;曹沙沙;孙月-东北大学工商管理学院, 辽宁沈阳 110169

全渠道模式下制造商与零售商的O2O合作策略研究

查晓宇;张旭梅;但斌;李梦丽;官子力-重庆大学经济与工商管理学院, 重庆 400044;重庆大学现代物流重庆市重点实验室, 重庆 400044

订单转保理融资模式下考虑零售商竞争的融资和库存决策研究

杨睿琳;曾小燕;钟远光;周永务-中山大学岭南学院,广东广州510275;广州城市理工学院经济学院,广东广州510800;华南理工大学工商管理学院,广东广州540640

考虑可提前还款的汽车租赁平台延期支付融资模式研究

吴晓黎;王文韬;刘胜博-华南理工大学工商管理学院,广东广州 510640

随机需求下批发价格与支付时间相关的零售商最优库存策略研究

周永务;陈怡;何欢;陈传营-华南理工大学工商管理学院,广东广州,510640;东莞理工学院经济与管理学院,广东东莞,523106

报童问题的"均值偏向"效应研究综述

李守荣;张人千-安徽建筑大学经济与管理学院,安徽合肥 230022;北京航空航天大学经济管理学院,北京 100191

时变需求下基于随机干扰和部分预支付的易腐品库存控制

陈金叶;彭扬-浙江经济职业技术学院,浙江杭州 310018;浙江工商大学,浙江杭州 310018

零售店货物的库存-配送集成化研究

邓旭东;张雨轩;马云峰-武汉科技大学恒大管理学院,湖北武汉 430070

数据驱动的服装物流分类及订货策略研究

袁媛;高波-太原科技大学交通与物流学院,山西太原 030024

基于信用保险的供应链决策模型与协调策略研究

李红萍;龚本刚;党秀静;陈久美-安徽农业大学经济管理学院,合肥230036;安徽工程大学经济与管理学院,芜湖241000;中国科学技术大学管理学院,合肥230026

三级OEM供应链在供需波动下的定价与批量协同决策

陈志明;张贵萍;唐龙海-广东金融学院信用管理学院,广州510521;广州新华学院管理学院,广州510520

无缺陷退货下考虑转运的双渠道供应链库存决策研究

冯平平;张婷丹;柴建;吴锋-西安电子科技大学经济与管理学院,西安710071;西安交通大学管理学院,西安710049

代理人过度自信条件下最优激励契约与备货联合决策研究

孔祥印;刘书琪;沈晓蓓;冯耕中-中国科学技术大学管理学院国际金融研究院,合肥230026;西安交通大学管理学院,西安710049

基于截断需求的分布鲁棒报童问题

黎俊;王曙明-中国科学院大学经济与管理学院,北京100190

产能不确定供应商的风险厌恶行为对供应链的影响

王田;郑重-中南财经政法大学工商管理学院,湖北武汉 430073;香港城市大学数据科学学院,香港特别行政区 999077

基于不同保鲜方式的生鲜品定价订货决策

唐跃武;范体军;程永伟-华东理工大学商学院,上海 200237;台州学院商学院,浙江台州 318000

需求信息不对称下基于战略库存的信息披露与契约选择

经有国;宋楗;刘震-昆明理工大学管理与经济学院,云南昆明 650093

库存成本变化的VMI供应链协调

罗岭-西北政法大学商学院,陕西西安 710122

不同交叉销售结构情境下竞争供应链运营决策研究

刘晓婧;付红;杜文意-江苏师范大学商学院,江苏徐州 221116;合肥工业大学管理学院,安徽合肥 230009

考虑有限理性的双渠道供应链订货量决策

金可然-东华大学旭日工商管理学院,上海 200051

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。