一种决策网络模型自博弈训练方法及系统

    公开(公告)号:CN109598342B

    公开(公告)日:2021-07-13

    申请号:CN201811410380.0

    申请日:2018-11-23

    IPC分类号: G06N3/08 G06N3/04

    摘要: 一种决策网络模型自博弈训练方法,包括如下步骤:步骤一、采用模拟退火算法对EN网络的初始网络参数进行变异,变异后得到红方EN网络和蓝方EN网络;步骤二、将步骤一中所述的红方EN网络和蓝方EN网络放入对抗环境进行博弈对抗,记录对抗关键节点的决策数据和EN值;步骤三、对步骤二中博弈对抗的胜利方的决策数据和EN值作为有效样本进行保存,将失败方的数据淘汰;步骤四、根据步骤三中的有效样本对EN网络进行训练,获得优化后的网络参数,将优化后的网络参数作为新的初始网络参数;步骤五、循环重复步骤一到步骤四,实现自博弈训练。本发明通过使用自博弈训练方法,可以形成层次化的AI决策智能体,为博弈指挥员提供高水平辅助决策支持。

    一种基于海量对抗仿真推演数据建模与分析的效能评估方法

    公开(公告)号:CN114239228A

    公开(公告)日:2022-03-25

    申请号:CN202111406625.4

    申请日:2021-11-24

    IPC分类号: G06F30/20

    摘要: 本发明提出一种基于海量对抗仿真推演数据建模与分析的效能评估方法,该方法采用正交试验设计手段,通过数据将维等方法,确定试验因子及水平要素,构建满足“信息不完全度多”、“敌我双方力量部署策略多”、“作战指控策略多”、“战场环境要素多”、“敌我武器装备性能要素多”的“五多”需求的决策评估场景,建立指标权重矩阵和评估目标函数,通过多层智能感知机和隶属度优化,确定指标参数与决策效果的关联关系,生成指标权重的优化分布结果,采用大数据与知识融合方法,对海量博弈推演结果进行综合评估,提高装备效能评估的客观性和准确性,同时构建一个“五多”相关的区间化参数与相应指标的映射关系,形成矩阵式评估结果查询表,提高装备效能评估的全面性。