典型文献
基于态势利导的需求响应自学习优化调度方法
文献摘要:
针对多随机场景下用户可选择需求响应(CCR)的场景组合激增问题,利用深度强化学习算法实现CCR群组的优选及其所包含节点的优化调度.首先,根据CCR优化调度的约束条件与目标函数,分析其数学模型及日调度周期的求解复杂度;然后,基于马尔可夫决策过程将CCR优化调度过程映射至态势感知元组,并基于竞争深度Q网络架构建立态势利导函数,通过多次态势推演,利用小批量梯度下降法对态势利导函数求导,不断反馈更新算法参数,实现决策优化;最后,基于IEEE 33节点算例,通过不同规模的随机样本数量,在随机运行方式下实现了待选CCR群组的优选,并制定相应的优化调度策略.
文献关键词:
可选择需求响应;深度强化学习;竞争深度Q网络;马尔可夫决策过程;态势感知;态势利导
中图分类号:
作者姓名:
明威宇;李妍;程时杰;龙禹;徐菁;王少荣
作者机构:
强电磁工程与新技术国家重点实验室,华中科技大学,湖北省武汉市 430074
文献出处:
引用格式:
[1]明威宇;李妍;程时杰;龙禹;徐菁;王少荣-.基于态势利导的需求响应自学习优化调度方法)[J].电力系统自动化,2022(23):109-116
A类:
可选择需求响应
B类:
态势利导,自学习优化,优化调度方法,随机场,CCR,激增,深度强化学习算法,算法实现,群组,调度周期,马尔可夫决策过程,态势感知,元组,网络架构,导函数,推演,小批量梯度下降,梯度下降法,函数求导,新算法,算法参数,决策优化,IEEE,点算,不同规模,随机样本,样本数量,机运,运行方式,调度策略
AB值:
0.302205
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。