FAILED
首站-论文投稿智能助手
典型文献
基于强化学习的地铁站空调系统节能控制
文献摘要:
地铁站空调系统能源消耗较大,传统控制方法无法兼顾舒适性和节能问题,控制效果不佳,且目前地铁站空调控制系统均是对风系统和水系统单独控制,无法保证整个系统的节能效果.鉴于此,提出基于强化学习的空调系统节能控制策略.首先,采用神经网络建立空调系统模型,作为离线训练智能体的模拟环境,以解决无模型强化学习方法在线训练收敛时间长的问题;然后,为了提升算法效率,同时针对地铁站空调系统多维连续动作空间的特点,提出基于多步预测的深度确定性策略梯度算法,设计智能体框架,将其用于与环境模型进行交互训练;此外,为了确定最佳的训练次数,设置了智能体训练终止条件,进一步提升了算法效率;最后,基于武汉某地铁站的实测运行数据进行仿真实验,结果表明,所提出控制策略具有较好的温度跟踪性能,能够保证站台舒适性,且与目前实际系统相比能源节省约17.908%.
文献关键词:
强化学习;深度确定性策略梯度法;神经网络;多步预测;地铁站空调系统;节能控制
作者姓名:
焦焕炎;冯浩东;魏东;冉义兵;胡朝文
作者机构:
北京建筑大学电气与信息工程学院,北京100044;建筑大数据智能处理方法研究北京市重点实验室,北京100044;北京兴创置地房地产开发有限公司,北京102600
文献出处:
引用格式:
[1]焦焕炎;冯浩东;魏东;冉义兵;胡朝文-.基于强化学习的地铁站空调系统节能控制)[J].控制与决策,2022(12):3139-3148
A类:
深度确定性策略梯度法
B类:
地铁站空调系统,系统节能,能源消耗,舒适性,节能问题,空调控制系统,风系统,水系统,节能效果,节能控制策略,系统模型,离线训练,智能体,模拟环境,决无,无模型,强化学习方法,在线训练,收敛时间,算法效率,时针,动作空间,多步预测,深度确定性策略梯度算法,计智,环境模型,交互训练,运行数据,略具,跟踪性能,站台,比能
AB值:
0.280614
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。