典型文献
强化学习性能最优控制框架及其在高压给水加热器运行优化中的应用
文献摘要:
针对现阶段火电机组运行工况频繁波动的情况,为了解决复杂动态过程难以辨识、控制器设定点无法确定的问题,提出了一种基于历史运行数据与强化学习算法的性能最优控制框架.在现有控制器的输出上叠加少量随机噪声,采用均匀化网格算法构建并维护包含典型工况的数据缓冲区,采用基于粒子群优化的连续批量Q学习算法离线求解性能最优控制策略函数.以高压给水加热器控制任务为研究对象,得到了 一种无需系统辨识也无需确定设定点即可保持变工况控制品质与换热性能的控制器求解方法.为了验证所提框架的通用性,利用某600 MW机组高压加热器的仿真模型对水位控制过程进行了分析.结果表明,基于强化学习的性能最优控制框架不需要建立系统模型,可以直接利用历史运行数据求解以累积性能最优为目标的控制策略函数,不仅在动态过程中可以达到较好的控制品质,稳态下也能使系统维持在性能较优的状态,相当于同时实现了设定值优化与设定点跟踪控制.
文献关键词:
给水加热器;强化学习;最优控制;运行优化
中图分类号:
作者姓名:
周东阳;曹军;毕胜山;邵壮;司风琪
作者机构:
西安交通大学热流科学与工程教育部重点实验室,710049,西安;西安热工研究院有限公司,710054,西安;东南大学能源热转换及其过程测控教育部重点实验室,210096,南京
文献出处:
引用格式:
[1]周东阳;曹军;毕胜山;邵壮;司风琪-.强化学习性能最优控制框架及其在高压给水加热器运行优化中的应用)[J].西安交通大学学报,2022(08):32-42
A类:
设定值优化
B类:
学习性,最优控制,给水加热器,运行优化,火电机组,机组运行,运行工况,频繁波动,动态过程,历史运行数据,强化学习算法,出上,随机噪声,均匀化,典型工况,缓冲区,粒子群优化,离线,策略函数,系统辨识,变工况,换热性能,求解方法,通用性,MW,高压加热器,水位控制,控制过程,建立系统,系统模型,相当于,设定点跟踪,跟踪控制
AB值:
0.340327
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。