典型文献
基于改进深度Q网络算法的多园区综合能源系统能量管理方法
文献摘要:
多园区综合能源系统可通过多能互补互济显著提升运行经济性,然而园区之间的复杂互动、多能耦合决策会给多园区综合能源系统的能量管理带来决策空间庞大、算法难以收敛等挑战性问题.为解决上述问题,提出了一种基于改进深度Q网络(modified deep Q network,MDQN)算法的多园区综合能源系统能量管理方法.首先,采用独立于园区的外部气象数据、历史互动功率数据,构建了基于长短期记忆(long short-term memory,LSTM)深度网络的各园区综合能源系统外部互动环境等值模型,降低了强化学习奖励函数的计算复杂度;其次,提出一种基于k优先采样策略的MDQN算法,用k-优先采样策略来代替ε 贪心策略,克服了大规模动作空间中探索效率低下的问题;最后,在含3个园区综合能源系统的算例中进行验证,结果表明MDQN算法相比原DQN算法具有更好的收敛性与稳定性,同时可以提升园区经济效益达29.16%.
文献关键词:
园区综合能源系统;深度强化学习;能量管理;改进深度Q网络(MDQN)算法
中图分类号:
作者姓名:
薛溟枫;毛晓波;肖浩;浦骁威;裴玮
作者机构:
国网江苏省电力有限公司无锡供电分公司,江苏省无锡市214000;中国科学院电工研究所,北京市100190
文献出处:
引用格式:
[1]薛溟枫;毛晓波;肖浩;浦骁威;裴玮-.基于改进深度Q网络算法的多园区综合能源系统能量管理方法)[J].电力建设,2022(12):83-93
A类:
MDQN
B类:
进深,网络算法,多园区综合能源系统,系统能量,能量管理,多能互补,互济,运行经济性,多能耦合,决策空间,挑战性问题,modified,deep,network,气象数据,历史互动,长短期记忆,long,short,term,memory,深度网络,各园,外部互动,动环,等值模型,奖励函数,计算复杂度,采样策略,贪心策略,动作空间,收敛性,园区经济,深度强化学习
AB值:
0.267279
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。