典型文献
基于多智能体深度强化学习的配电网无功优化策略
文献摘要:
配电网中光伏、风机设备出力随机波动以及负荷波动带来的电压波动、网损增加等问题,给配电网在线无功优化带来了挑战.本文采用一种无模型的深度确定性策略梯度(MADDP G)算法多智能体强化学习框架,采用集中训练、分散执行的方式解决无功优化问题.MADDP G算法将每一个智能体当作一个行动者(Actor),在离线训练过程中每个Actor可以借助一个评论家(Critic)进行训练.所提策略用深度神经网络拟合可投切电容器、有载调压变压器分接头以及分布式电源逆变器的动作函数,在和配电网环境交互过程中完成深度神经网络的训练.利用该强化学习算法在线实时决策无功调节设备的调度方案,此方法不需要通过精确的潮流建模,也不依赖于日前的数据预测,适用于通信能力较弱的部分观测配电网.最后,通过算例来验证MADDP G算法的有效性.
文献关键词:
多智能体;深度强化学习;无功优化;数据驱动;低感知度配电网
中图分类号:
作者姓名:
邓清唐;胡丹尔;蔡田田;李肖博;徐贤民;彭勇刚
作者机构:
南方电网数字电网研究院有限公司,广东 广州510663;浙江大学电气工程学院,浙江 杭州310027
文献出处:
引用格式:
[1]邓清唐;胡丹尔;蔡田田;李肖博;徐贤民;彭勇刚-.基于多智能体深度强化学习的配电网无功优化策略)[J].电工电能新技术,2022(02):10-20
A类:
MADDP,低感知度配电网
B类:
多智能体深度强化学习,配电网无功优化,风机,机设备,出力,随机波,负荷波动,电压波动,网损,加等,无模型,深度确定性策略梯度,多智能体强化学习,决无,优化问题,行动者,Actor,离线训练,训练过程,评论家,Critic,深度神经网络,投切电容,电容器,有载调压,变压器分接头,分布式电源,逆变器,强化学习算法,实时决策,无功调节,调节设备,调度方案,不依,日前,数据预测
AB值:
0.334883
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。