一种被控系统群的运行策略协同优化方法及装置

    公开(公告)号:CN118674109A

    公开(公告)日:2024-09-20

    申请号:CN202410798959.8

    申请日:2024-06-20

    Abstract: 本发明涉及运行策略优化领域,提供了一种被控系统群的运行策略协同优化方法及装置,方法包括:根据仿真结果确定各动作的Q因子样本方差、各最优动作与非最优动作的Q因子融合值的性能差别以及已消耗样本总量;利用采样数据分配算法对上述量进行分析得到各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量确定各动作补充采样量;根据补充采样量进行补充采样,利用补充仿真结果重新确定各动作的Q因子样本方差、性能差别以及已消耗样本总量;调整已消耗样本总量,判断已消耗样本总量是否小于预设总采样量,若是重新计算目标样本量及之后步骤,若否输出最优动作。本发明协同使用动作一致性的被控系统的运行数据,能够提升优化效率及性能。

    一种被控系统运行调度的高效率强化学习方法及装置

    公开(公告)号:CN118674066A

    公开(公告)日:2024-09-20

    申请号:CN202410798963.4

    申请日:2024-06-20

    Abstract: 本发明涉及强化学习领域,提供了一种被控系统运行调度的高效率强化学习方法及装置,方法包括:对被控系统的各状态‑动作对进行采样,根据采样结果确定各状态下各动作的动作类型、Q因子样本方差及已消耗样本总量;利用采样数据分配算法确定各状态下各动作目标样本量;根据各动作目标样本量与各动作已消耗样本量,确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样的仿真结果重新确定各动作的动作类型、各状态‑动作对的Q因子样本方差;调整已消耗采样总量,判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够区分各状态动作的重要性,提升采样效率及优化策略性能。

    一种被控系统运行调度的监督强化学习方法及装置

    公开(公告)号:CN118674068A

    公开(公告)日:2024-09-20

    申请号:CN202410804234.5

    申请日:2024-06-20

    Abstract: 本发明涉及强化学习领域,提供了一种被控系统运行调度的监督强化学习方法及装置,包括:确定各状态‑动作对的Q因子、Q因子样本方差以及已消耗样本总量;计算各状态下各非观测最优动作的重要性,将重要性排名前△M个非观测最优动作发送至监督者;调整已消耗采样总量,利用采样数据分配算法对各状态‑动作对的Q因子样本方差及已消耗样本总量进行分析得到各状态下各动作目标样本量;确定各动作补充采样数量;根据各动作补充采样数量进行补充采样,利用补充采样结果重新确定之前的步骤;判断已消耗样本总量满足动作采样数量约束条件,若是,则输出各状态下观测到的最优动作,本发明能够将监督者的监督与采样数据融合起来,提升学习效率及性能。

    一种基于分组排序的仿真计算加速方法和相关装置

    公开(公告)号:CN117707769B

    公开(公告)日:2025-01-10

    申请号:CN202311720266.9

    申请日:2023-12-14

    Abstract: 本发明公开了一种基于分组排序的仿真计算加速方法和相关装置,根据每个控制计算块的输入数量和输出数量,对所有控制计算块进行分组,得到若干个计算组,根据每个计算组的输入数量大小,将每个计算组作为一个独立单元进行排序,按计算时间均衡原则一次将各计算组放入对应的并行计算单元中,实现了在不影响控制计算块时序的情况下,以组合成计算组的方式将控制计算块均衡分配到并行计算单元中,在合理利用计算资源的同时,提高了计算效率,解决了现有的电力系统电磁暂态仿真计算过程没有充分考虑多并行计算单元的资源分配和顺序安排对最终计算时间的影响,难以实现对计算硬件系统的合理利用,难以提高计算效率的技术问题。

Patent Agency Ranking