-
公开(公告)号:CN118040733A
公开(公告)日:2024-05-14
申请号:CN202410088039.7
申请日:2024-01-22
发明人: 拉巴顿珠 , 贺文婷 , 索朗多布杰 , 张洪峰 , 曾非同 , 李小飞 , 杨玉鑫 , 李明佳 , 徐金成 , 周文龙 , 琼次仁 , 格桑曲珍 , 陈宇沁 , 周峰 , 殷小东 , 雷民
摘要: 本发明公开了一种电力系统电力拓扑架构的优化方法、装置及电子设备,该方法包括:以在各类运行场景下最大化电网的可用传输容量为优化目标,建立深度Q网络模型;对深度Q网络模型的权值进行初始化;考察环境的当前状态,并使用环境贪婪策略选择一个动作并执行;由深度Q网络模型观察奖励/状态转换的结果,并观察环境中由此产生的状态转变;存储学习过程中当前状态的观察体验、采取的行动、所获得的奖励以及由此产生的下一个状态;从存储的体验中选择一批体验,通过将该批体验对应的预测Q值与预设的目标Q值之间的损失最小化,来更新模型的权值和对应的预测Q值,最终根据模型输出的最优化动作控制储能设备,以最大化电网的可用传输容量。