典型文献
基于深度强化学习的电网前瞻调度智能决策架构及关键技术初探
文献摘要:
随着新型电力系统建设的快速推进,电网运行方式不确定性增加,调度对象类型/数量指数级增长,当前基于物理模型的电网调度计划存在优化决策计算速度慢、耗时长以及应对多重不确定场景适应性不够等问题,特别是日内阶段仍经常依赖调度员人工调控.为此,该文结合电网前瞻调度的时序滚动优化、多元对象决策、调度多目标构建等实际特点,提出基于深度强化学习的电网前瞻调度智能决策功能架构,分析离线训练模块、在线决策模块和效果评估模块3部分的具体实现;并在适用于电网前瞻调度的深度强化学习算法、学习样本效率提升、调度多目标奖励函数设计、拓扑改变情形下的迁移学习和前瞻调度效果评估等关键技术方面进行了初步探索,基于IEEE30节点算例验证了所提算法和技术的有效性.最后,探讨了电网前瞻调度智能决策需进一步研究的问题.
文献关键词:
数据驱动;深度强化学习;电网;前瞻调度;奖励函数;迁移学习
中图分类号:
作者姓名:
王珂;姚建国;余佩遥;杨胜春;钟海旺;严嘉豪
作者机构:
河海大学能源与电气学院,江苏省 南京市 210098;中国电力科学研究院有限公司,江苏省 南京市 210003;合肥工业大学电气与自动化工程学院,安徽省 合肥市 230009;清华大学电机工程与应用电子技术系,北京市 海淀区 100084
文献出处:
引用格式:
[1]王珂;姚建国;余佩遥;杨胜春;钟海旺;严嘉豪-.基于深度强化学习的电网前瞻调度智能决策架构及关键技术初探)[J].中国电机工程学报,2022(15):5430-5438,中插4
A类:
前瞻调度
B类:
智能决策,新型电力系统建设,快速推进,电网运行方式,对象类型,数级,物理模型,电网调度,调度计划,优化决策,计算速度,速度慢,多重不确定,不确定场景,调度员,人工调控,滚动优化,功能架构,离线训练,在线决策,效果评估,深度强化学习算法,样本效率,奖励函数,迁移学习,初步探索,IEEE30,点算,算例验证
AB值:
0.328638
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。