基于深度强化学习的电动汽车智能激励方法和装置
摘要:
本发明涉及一种基于深度强化学习的电动汽车智能激励方法和装置,包括建立基于马尔科夫博弈模型的分类型的电动汽车充放电优化目标模型;建立分类型的电动汽车智能体模型,利用分类型的电动汽车充放电优化目标模型对分类型的电动汽车智能体模型进行训练,得到电动汽车智能体充放电优化策略模型,通过电动汽车智能体充放电优化策略模型中,得到当前时刻电动汽车的最优充放电策略。本发明建立面向电动汽车用户与负荷聚合商交互的多方博弈模型,运用深度强化学习算法求解,实现了不同场景下多类型电动汽车和聚合商的协同最优。本发明还涉及一种设备和存储介质。
0/0