典型文献
计及负荷不确定性的强化学习实时定价策略
文献摘要:
面对当前电力系统的负荷不确定、新能源并网与双碳目标等现状,在充分考虑供需双方福利前提下,建立了智能电网背景下考虑负荷不确定与碳交易的实时定价模型,并基于强化学习能够处理变量复杂性、非凸非线性问题优点,采用强化学习中Q学习算法对模型进行迭代求解.首先,将用户与供电商实时交互过程转换为强化学习框架对应的马尔可夫决策过程;其次,通过智能体在动态环境中的反复探索表示用户与供电商的信息交互;最后,通过强化学习中的Q学习算法寻找最优值即最大社会福利值.仿真结果表明,所提实时定价策略能够有效提升社会福利,降低碳排放总量,这验证了所提模型和算法的有效性.
文献关键词:
实时定价;强化学习;马尔可夫决策过程;负荷不确定;双碳目标
中图分类号:
作者姓名:
王菁祺;高岩;吴志强;李仁杰
作者机构:
上海理工大学 管理学院,上海200093
文献出处:
引用格式:
[1]王菁祺;高岩;吴志强;李仁杰-.计及负荷不确定性的强化学习实时定价策略)[J].计算机应用研究,2022(09):2640-2646,2659
A类:
B类:
负荷不确定性,确定性的,强化学习,实时定价,定价策略,电力系统,新能源并网,双碳目标,供需双方,智能电网,碳交易,定价模型,处理变量,非凸,非线性问题,迭代求解,实时交互,马尔可夫决策过程,智能体,动态环境,信息交互,最优值,大社,社会福利,低碳排放,碳排放总量,和算
AB值:
0.324845
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。