典型文献
基于深度强化学习的湿法脱硫系统运行优化
文献摘要:
针对传统石灰石/石膏湿法烟气脱硫(WFGD)系统运行优化方式适应性不强,效率低,资源消耗大等问题,提出了一种基于数据驱动建模和深度强化学习的脱硫系统运行优化方法.首先为解决传统PCA只能衡量特征变量间线性关系的局限性,将互信息(MI)引入PCA中优化主成分分析结果和长短期记忆网络(LSTM)的输入变量;然后利用改进粒子群(IPSO)确定LSTM的最优参数组合,降低LSTM训练成本;最后基于MIPCA-IPSO-LSTM模型构建脱硫系统与强化学习的快速交互环境.考虑到传统深度确定性策略梯度(DDPG)算法存在收敛速度比较慢,训练不稳定耗时长,样本利用效率低的问题,文章提出采用基于累计回报的双经验池回放机制的深度确定性策略梯度(DER-DDPG)算法搭建优化仿真平台.文章以某电厂600MW机组脱硫系统为例,基于Python语言和TensorFlow框架下的仿真结果表明,与传统PCA相比,MIPCA能够保留更多原始数据信息并剔除冗余信息;IPSO可以提高PSO的全局寻优能力和收敛速度,与其他传统模型相比,当LSTM具有2层隐含层时具有更高的预测性能;DER-DDPG算法得出的优化策略在满足脱硫系统实际工艺参数需要的前提下,有效地降低了脱硫的运行成本,相比DQN算法和DDPG算法更具实际应用价值,能满足脱硫系统运行优化的需要.
文献关键词:
双经验池回放机制;DDPG算法;互信息;主成分分析;粒子群;LSTM网络;运行优化
中图分类号:
作者姓名:
吴磊;康英伟
作者机构:
上海电力大学自动化工程学院,上海200090
文献出处:
引用格式:
[1]吴磊;康英伟-.基于深度强化学习的湿法脱硫系统运行优化)[J].系统科学与数学,2022(05):1067-1087
A类:
优化主成分分析,MIPCA,双经验池回放机制
B类:
深度强化学习,湿法脱硫系统,运行优化,石灰石,石膏湿法,湿法烟气脱硫,WFGD,优化方式,资源消耗,数据驱动建模,先为,特征变量,互信息,长短期记忆网络,改进粒子群,IPSO,最优参数,数组,练成,速交,交互环境,深度确定性策略梯度,DDPG,收敛速度,速度比,比较慢,本利,DER,优化仿真,仿真平台,600MW,Python,TensorFlow,原始数据,冗余信息,全局寻优,寻优能力,传统模型,隐含层,预测性能,运行成本,DQN
AB值:
0.271258
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。