基于先验策略引导下的深度强化学习快速搜索博弈方法及系统

    公开(公告)号:CN118014013A

    公开(公告)日:2024-05-10

    申请号:CN202410046727.7

    申请日:2024-01-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于先验策略引导下的深度强化学习快速搜索博弈方法及系统,主要面对双智能体博弈环境。根据博弈环境和博弈规则,获取包括估值函数的估值博弈策略Est(s),将该策略与蒙特卡洛树搜索算法结合,获得启发式蒙特卡洛树搜索算法,并使用该算法进行博弈,获得博弈数据集D;构造神经网络,通过数据集D学习启发式蒙特卡洛树搜索算法,用收敛后的神经网络fη(s)替代启发式蒙特卡洛树搜索中的估值博弈策略Est(s),获得快速神经网络树搜索算法F(s),从而实现深度强化学习的快速搜索博弈。本发明创造了启发式蒙特卡洛树搜索算法,缩短了决策时间,超越了基准模型的博弈水平,有极高的应用价值。

    一种基于改进Nataf的电力系统可靠性评估方法

    公开(公告)号:CN118134683A

    公开(公告)日:2024-06-04

    申请号:CN202410016377.X

    申请日:2024-01-04

    Abstract: 本发明公开了一种基于改进Nataf的电力系统可靠性评估方法,将电力系统可靠性评估流程中的针对系统随机影响因素的样本生成的方法使用改进Nataf抽样技术进行加速;电力系统可靠性评估流程包括针对系统随机影响因素的样本生成、针对样本的可靠性指标计算两个环节;所述改进Nataf抽样方法包含改进初值点生成、原始相关性检验矩阵快速生成、正态相关性矩阵计算、半正定矩阵最优映射、反函数映射样本生成。本发明可应用于包含高维且具有相关性的不确定系统对象的运行评估之中,支撑任意分布的快速样本生成、可靠性分析等应用场景;针对传统Nataf变换应用到电力系统可靠性分析时,解决任意分布时计算时间冗长的问题。

Patent Agency Ranking