首站-论文投稿智能助手
典型文献
基于深度强化学习的主动配电网高恢复力决策方法
文献摘要:
随着全球极端天气事件频发,电力系统在极端自然灾害下恢复力的研究日益受到关注.本文提出基于深度强化学习的高恢复力决策方法,将极端灾害下配电网运行状态和线路故障状态作为观测状态集合,自学习智能体Agent在当前环境观测状态下寻求可行的决策策略进行动作,定义自学习Agent的回报函数以进行动作评价;采用观测状态数据,开展基于竞争深度Q网络(dueling deep Q network,DDQN)的深度强化学习(deep reinforcement learning,DRL)训练,智能体Agent通过试错学习方式选择动作,试错经验在估值函数Q矩阵中存储,实现状态到主动配电网实时故障恢复策略的非线性映射;最后结合改进的IEEE 33节点算例,基于蒙特卡罗法仿真随机故障场景,对所提出方法生成的故障恢复随机优化决策进行分析.结果表明:通过主动配电网的分布式电源、联络开关和可中断负荷的协调优化控制,可以有效提升极端灾害下供电能力.
文献关键词:
马尔科夫决策过程;竞争深度Q网络(DDQN);深度强化学习(DRL);高恢复力;配电网
作者姓名:
罗欣儿;杜进桥;田杰;刘安迪;王标;李妍;王少荣
作者机构:
深圳供电局有限公司,广东 深圳518001;华中科技大学强电磁工程与新技术国家重点实验室,武汉430074
文献出处:
引用格式:
[1]罗欣儿;杜进桥;田杰;刘安迪;王标;李妍;王少荣-.基于深度强化学习的主动配电网高恢复力决策方法)[J].南方电网技术,2022(01):67-74
A类:
高恢复力
B类:
深度强化学习,主动配电网,决策方法,极端天气事件,电力系统,极端自然灾害,极端灾害,配电网运行,线路故障,故障状态,观测状态,状态集,自学习,智能体,Agent,环境观,决策策略,动作评价,状态数据,dueling,deep,network,DDQN,reinforcement,learning,DRL,试错,学习方式,方式选择,估值,值函数,故障恢复策略,非线性映射,IEEE,点算,蒙特卡罗法,随机故障,故障场景,随机优化,优化决策,分布式电源,联络开关,可中断负荷,协调优化控制,供电能力,马尔科夫决策过程
AB值:
0.378418
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。