首站-论文投稿智能助手
典型文献
基于强化学习的电动汽车换电站实时调度策略优化
文献摘要:
随着电动汽车的应用推广,换电站的调度优化逐渐成为研究热点.传统的基于换电需求预测值的调度策略在实际应用中面临着难以适应动态干扰因素、预测误差累积等问题.为了解决这些问题,提出了一种基于带基线的蒙特卡罗策略梯度法的换电站实时调度策略,用于优化换电站的充放电策略以及响应电池数量.提出了带基线的蒙特卡罗策略梯度强化学习,并为换电站实时调度问题选取合适的状态空间和动作空间;设计了奖励函数对智能体进行离线训练,从电池状态数据、分时电价和排队电动汽车数量中学习得到最优策略网络;在离线训练好的模型基础上进行实时调度策略测试.基于换电站的服务可用率和经济效益验证了所提调度策略的有效性和经济性,算例结果表明所提策略能对电网负荷起到一定的削峰填谷作用.
文献关键词:
电动汽车;换电站;强化学习;策略梯度;分时电价;实时调度
作者姓名:
张文昕;栗然;臧向迪;严敬汝;祝晋尧
作者机构:
华北电力大学 电气与电子工程学院,河北 保定 071003;国网河北省电力有限公司电力科学研究院,河北 石家庄 050022;国网石家庄供电公司,河北 石家庄 050004
文献出处:
引用格式:
[1]张文昕;栗然;臧向迪;严敬汝;祝晋尧-.基于强化学习的电动汽车换电站实时调度策略优化)[J].电力自动化设备,2022(10):134-141
A类:
B类:
强化学习,电动汽车,换电站,实时调度策略,策略优化,应用推广,调度优化,换电需求,需求预测,动态干扰,干扰因素,预测误差,误差累积,蒙特卡罗,策略梯度,梯度法,充放电策略,电池数量,调度问题,状态空间,动作空间,奖励函数,智能体,离线训练,电池状态,状态数据,分时电价,排队,习得,最优策略,策略网络,练好,可用率,提调,电网负荷,削峰填谷
AB值:
0.342589
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。