首站-论文投稿智能助手
典型文献
基于分布式深度强化学习的微电网实时优化调度
文献摘要:
随着海量新能源接入到微电网中,微电网系统模型的参数空间成倍增长,其能量优化调度的计算难度不断上升.同时,新能源电源出力的不确定性也给微电网的优化调度带来巨大挑战.针对上述问题,本文提出了一种基于分布式深度强化学习的微电网实时优化调度策略.首先,在分布式的架构下,将主电网和每个分布式电源看作独立智能体.其次,各智能体拥有一个本地学习模型,并根据本地数据分别建立状态和动作空间,设计一个包含发电成本、交易电价、电源使用寿命等多目标优化的奖励函数及其约束条件.最后,各智能体通过与环境交互来寻求本地最优策略,同时智能体之间相互学习价值网络参数,优化本地动作选择,最终实现最小化微电网系统运行成本的目标.仿真结果表明,与深度确定性策略梯度算法(DDPG)相比,本方法在保证系统稳定以及求解精度的前提下,训练速度提高了 17.6%,成本函数值降低了67%,实现了微电网实时优化调度.
文献关键词:
强化学习;分布式优化;微电网;优化调度;优化算法
作者姓名:
郭方洪;何通;吴祥;董辉;刘冰
作者机构:
浙江工业大学信息工程学院,浙江杭州310034
文献出处:
引用格式:
[1]郭方洪;何通;吴祥;董辉;刘冰-.基于分布式深度强化学习的微电网实时优化调度)[J].控制理论与应用,2022(10):1881-1889
A类:
B类:
深度强化学习,实时优化调度,新能源接入,微电网系统,系统模型,参数空间,成倍增长,能量优化调度,新能源电源,出力,调度策略,主电网,分布式电源,智能体,地学,立状,动作空间,一个包,发电成本,交易电价,多目标优化,奖励函数,最优策略,互学习,学习价值,价值网络,网络参数,地动,系统运行成本,深度确定性策略梯度算法,DDPG,保证系统,系统稳定,训练速度,成本函数,函数值,分布式优化
AB值:
0.335298
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。