典型文献
面向综合能源系统的多智能体协同AGC策略
文献摘要:
针对大规模可再生能源接入电网所带来的强随机扰动问题,从自动发电控制的角度提出感知历史经验的多智能体深度强化学习算法,即具有置信区间上界的深度强化学习(DQN-UCB).所提方法通过置信区间上界(UCB)策略来解决传统启发式方法在平衡"探索-利用"过程中,面对随机低质量样本带来的当前和目标Q值误差较大的问题;同时,基于置信区间上界策略的优先级采样机制替代了传统深度Q学习(DQN)的均匀随机采样机制,以提高高质量样本被选取的概率,进而促使智能体快速收敛到最优策略.通过对IEEE标准两区域负荷频率控制模型和融入大规模可再生能源的分布式多区域综合能源系统模型进行仿真,结果表明,与其他智能方法相比,所提方法具有更优的控制性能、更快的收敛速度,能够获取分布式多区域综合能源系统的最优协同.
文献关键词:
综合能源系统;自动发电控制;多智能体;深度强化学习;置信区间上界;探索-利用;采样机制
中图分类号:
作者姓名:
席磊;王昱昊;陈宋宋;陈珂;孙梦梦;周礼鹏
作者机构:
三峡大学 电气与新能源学院,湖北 宜昌443002;中国电力科学研究院有限公司 需求侧多能互补优化与供需互动技术北京市重点实验室,北京100192
文献出处:
引用格式:
[1]席磊;王昱昊;陈宋宋;陈珂;孙梦梦;周礼鹏-.面向综合能源系统的多智能体协同AGC策略)[J].电机与控制学报,2022(04):77-88
A类:
置信区间上界
B类:
多智能体协同,AGC,可再生能源,能源接入,随机扰动,动问,自动发电控制,多智能体深度强化学习,深度强化学习算法,DQN,UCB,启发式方法,低质量,优先级,采样机制,随机采样,快速收敛,最优策略,IEEE,负荷频率控制,控制模型,多区域综合能源系统,系统模型,智能方法,控制性能,收敛速度,取分
AB值:
0.218714
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。