一种基于多步回溯强化学习算法的输电网扩展规划方法
摘要:
本发明公开了一种基于多步回溯强化学习算法的输电网扩展规划方法,属于电网规划技术领域,本发明包括以下步骤:步骤1:建立输电网扩展规划优化模型;步骤2:基于构建的规划模型构建电网交互环境和智能体状态、动作、知识矩阵、资格迹矩阵,并给出基于行为分类的智能体动作策略;步骤3:设定自适应学习因子α,基于学习进程修正Q值计算方法,并设计阶段反馈奖励函数,构建多步回溯α‑Q(λ)算法;步骤4:根据步骤3构建的多步回溯α‑Q(λ)算法求解输电网多目标优化规划模型,得到最优输电网扩展规划方案及智能体规划经验,为电网规划提供新的思路。
0/0