典型文献
基于深度强化学习的医用设备应急调度优化技术研究
文献摘要:
针对大型医用设备人工管理效率低、无法满足应急调度需求的问题,文中提出了基于深度强化学习算法的医用设备应急调度优化技术.使用物联网技术采集大型医用设备日常使用的各类参数,作为后续调度优化算法的样本数据.通过对医用设备调度问题的分析,采用马尔可夫决策过程作为调度优化算法的基础模型,并给出了状态空间、动作空间以及奖惩函数的定义.同时,以贪婪策略作为强化学习的动作探索策略,使用Tanh函数作为激活函数,从而提高了对非线性复杂数据的学习能力;使用DDPG算法在经验数据中获得价值估计和行为估计.经测试,文中所提出的医用设备应急调度优化算法可合理安排医用设备的使用,提高其综合利用率,与未使用应急调度算法的情况对比,检查耗时平均缩短了31.2%.
文献关键词:
医用设备应急调度优化算法;深度强化学习;马尔可夫决策过程;贪婪策略;Tanh函数;DDPG算法
中图分类号:
作者姓名:
夏天;黄冠;李颖
作者机构:
湖北省肿瘤医院设备科,湖北武汉430079
文献出处:
引用格式:
[1]夏天;黄冠;李颖-.基于深度强化学习的医用设备应急调度优化技术研究)[J].电子设计工程,2022(03):35-39
A类:
医用设备应急调度优化算法
B类:
优化技术,大型医用设备,人工管理,管理效率,调度需求,深度强化学习算法,使用物,物联网技术,日常使用,设备调度,调度问题,马尔可夫决策过程,基础模型,状态空间,动作空间,奖惩,贪婪策略,略作,探索策略,Tanh,激活函数,非线性复杂,复杂数据,DDPG,经验数据,合理安排,设备的使用,综合利用率,调度算法,检查耗时
AB值:
0.276883
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。