-
公开(公告)号:CN114329928A
公开(公告)日:2022-04-12
申请号:CN202111530474.3
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
IPC分类号: G06F30/20
摘要: 一种装备模型的模块化组装与总体参数快速生成方法,基于类基因图谱表征重组技术和模块化理论,在战场环境复杂与战场任务多变的情况下,通过积木模块化装备建模和构建极大似然模型对装备多源基因重组数据拟合,建立起装备模型的模块化组装与总体参数快速生成方法,解决了传统建模方法复用性差、模块不通用,难以适应装备快速升级换代的问题,提供了更为友好、更加灵活的建模方法。
-
公开(公告)号:CN114329928B
公开(公告)日:2024-04-09
申请号:CN202111530474.3
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
IPC分类号: G06F30/20
摘要: 一种装备模型的模块化组装与总体参数快速生成方法,基于类基因图谱表征重组技术和模块化理论,在战场环境复杂与战场任务多变的情况下,通过积木模块化装备建模和构建极大似然模型对装备多源基因重组数据拟合,建立起装备模型的模块化组装与总体参数快速生成方法,解决了传统建模方法复用性差、模块不通用,难以适应装备快速升级换代的问题,提供了更为友好、更加灵活的建模方法。
-
公开(公告)号:CN114818855A
公开(公告)日:2022-07-29
申请号:CN202210248874.3
申请日:2022-03-14
申请人: 中国运载火箭技术研究院
发明人: 路鹰 , 何昳頔 , 郑本昌 , 惠俊鹏 , 黄虎 , 李君 , 阎岩 , 张佳 , 任金磊 , 吴志壕 , 王振亚 , 范佳宣 , 李丝然 , 李博遥 , 刘峰 , 范中行 , 张旭辉 , 陈海鹏 , 赵大海 , 韩特 , 矫慧
摘要: 基于概率推理模型多源异构信息融合的态势评估方法,第一步,在军事态势数据融合系统中,采用开启一个特定传感器的策略,以期收集更多的信息,同时也可能因此而把传感器的位置暴露给敌人,促使其采取行动有效地改变态势;第二步,融合推理过程的不确定性反映了多源信息不确定性的动态积累和传播过程,在融合的每一步都要综合多源信息的不确定性因素,随着推理的进行,最终得到不确定性的结论。本发明解决了融合系统中的各种不确定性因素影响问题,有效提升了融合系统的稳定性。
-
公开(公告)号:CN114330651A
公开(公告)日:2022-04-12
申请号:CN202111530472.4
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
发明人: 路鹰 , 郑本昌 , 惠俊鹏 , 黄虎 , 李君 , 张佳 , 任金磊 , 阎岩 , 王振亚 , 范佳宣 , 李丝然 , 何昳頔 , 李博遥 , 吴志壕 , 刘峰 , 范中行 , 张旭辉 , 陈海鹏 , 赵大海 , 韩特 , 矫慧 , 古月 , 郭晶
摘要: 本发明公开了一种面向多要素联合指控的分层多智能体增强学习方法,针对强化学习的状态空间、动作空间和奖励机制进行建模,在多智能体环境下分别进行研究和设计,将Actor‑Critic网络的思想融入多智能体环境之中,形成顶层制定规划,底层执行的智能决策框架,并在模型中使用多层次的结构分别学习不同层次的策略来提高模型解决复杂问题的能力,实现了底层的并行训练,进而实现了智能体的自主行动规划。
-
公开(公告)号:CN114281103A
公开(公告)日:2022-04-05
申请号:CN202111532038.X
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
发明人: 惠俊鹏 , 范佳宣 , 张旭辉 , 路鹰 , 陈海鹏 , 李博遥 , 黄虎 , 王振亚 , 李君 , 郑本昌 , 阎岩 , 李丝然 , 何昳頔 , 张佳 , 任金磊 , 吴志壕 , 刘峰 , 范中行 , 王鹏 , 吴海华 , 程炳琳 , 周辉 , 韩特 , 王颖昕 , 刘洋 , 孟元军
IPC分类号: G05D1/10
摘要: 零交互通信的飞行器集群协同搜索方法,利用目标阵型分布的信息,统计目标位置分布的数据,形成先验信息;初始化搜索经验池和搜索策略,并建立搜索任务交互环境;构建基于多智能体强化学习的飞行器集群协同搜索框架,智能体从环境中获得观测信息;为每个智能体构建内在奖励Q网络、外在奖励Q网络,为飞行器集群构建混合Q网络,进行学习训练;执行时,智能体依据局部的观察进行动作选择,满足大部分实际环境的现实约束。本发明解决了现有技术中存在的搜索空间大场景内奖励稀疏智能体难以获得奖励信号学习缓慢、搜索过程依赖通信和全局信息等问题。
-
公开(公告)号:CN114358142A
公开(公告)日:2022-04-15
申请号:CN202111532049.8
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
发明人: 惠俊鹏 , 阎岩 , 路鹰 , 陈海鹏 , 黄虎 , 李丝然 , 范中行 , 范佳宣 , 李博遥 , 任金磊 , 王振亚 , 李君 , 郑本昌 , 何昳頔 , 张佳 , 吴志壕 , 刘峰 , 张旭辉 , 王鹏 , 吴海华 , 刘岱 , 周辉 , 古月 , 肖肖
IPC分类号: G06K9/62
摘要: 本发明公开了一种基于人机结合策略学习的目标智能分配方法和系统,该包括:步骤1,基于人工经验准则策略样本库,建模并训练得到目标分配准则模型;步骤2,基于AHP的量化样本库,建模并训练得到目标特性量化模型;步骤3,根据任务需求和目标态势输入,利用步骤1得到的目标分配准则模型和步骤2得到的目标特性量化模型,进行目标分配建模优化,得到目标分配结果。本发明能够有效融入人类经验,同时支持目标分配的机器学习与训练,有效发挥人机各自的特长的目标分配方法需要探索,以促进人机结合策略学习,提升决策效果和效率。
-
公开(公告)号:CN114358141A
公开(公告)日:2022-04-15
申请号:CN202111530475.8
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
发明人: 李博遥 , 郑本昌 , 路鹰 , 黄虎 , 惠俊鹏 , 陈海鹏 , 王振亚 , 李君 , 阎岩 , 范佳宣 , 李丝然 , 何昳頔 , 张佳 , 任金磊 , 吴志壕 , 刘峰 , 范中行 , 张旭辉 , 赵大海 , 韩特 , 肖肖
IPC分类号: G06K9/62
摘要: 一种面向多作战单元协同决策的多智能体增强学习方法,包括步骤如下:针对红蓝方博弈对抗场景,建立多智能体增强学习模型,实现面向多作战单元的智能协同决策建模;采用事后目标转换方法增加有效训练样本数量,实现多智能体增强学习模型的优化收敛;以团队全局任务奖励为基准,以各作战单元具体动作奖励作为反馈信息,构建奖励函数;根据不同作战方案生成多种对手策略,利用奖励函数通过海量模拟博弈对抗对多智能体增强学习模型进行训练。本发明解决了现有技术中存在的红蓝方博弈对抗多作战单元决策协同性低、有价值训练样本难获取等问题。
-
公开(公告)号:CN115619157A
公开(公告)日:2023-01-17
申请号:CN202211287356.9
申请日:2022-10-20
申请人: 中国运载火箭技术研究院
IPC分类号: G06Q10/0631 , G06Q10/10 , G06N3/04 , G06N3/08 , G06Q50/26
摘要: 本发明涉及一种基于共识信息压缩与预测的在线任务规划方法及系统,提出了一种知识驱动的自编码器模型,融合目指信息、情报知识对侦查信息进行信源编码,实现目标类型、坐标与运动特性态势信息高效压缩;提出了一种基于蒙特卡洛树的队友行动预测方法,可以实现多智能体基于预测的协同行为动态规划,支撑实现无协商式在线任务目标分配。本发明解决了现有技术中在通信降级条件下存在的在线任务动态规划效能差、泛化性差等问题。
-
公开(公告)号:CN114826417A
公开(公告)日:2022-07-29
申请号:CN202210253739.8
申请日:2022-03-15
申请人: 中国运载火箭技术研究院
IPC分类号: H04B10/532 , H04B10/516 , H04B10/50 , H04B10/61 , H04B7/185
摘要: 本发明提供了一种用于集群一对多信息共享的发射端、接收端及共享方法,该发射端安装于主飞行器上,用于将实时待分享信息转换为数字编码;构建偏振光场,并将数字编码加载至偏振光场中,形成覆盖从飞行器群所在区域的编码后的偏振光场,利用偏振光场偏振态的实时变化传递实时待分享信息,实施对其他从飞行器群的一对多信息共享;所述接收端安装于从飞行器上,用于在从飞行器处于主飞行器发射端构建并发射的经编码后的偏振光场中时,确定从飞行器所在区域偏振光场偏振态的实时变化,进而获取主飞行器的传递信息,实现与主飞行器的一对多信息共享。本发明解决了集群飞行器一对多信息共享难题,解决了集群飞行器间信息共享对电磁干扰的适应性难题。
-
公开(公告)号:CN114281103B
公开(公告)日:2023-09-29
申请号:CN202111532038.X
申请日:2021-12-14
申请人: 中国运载火箭技术研究院
发明人: 惠俊鹏 , 范佳宣 , 张旭辉 , 路鹰 , 陈海鹏 , 李博遥 , 黄虎 , 王振亚 , 李君 , 郑本昌 , 阎岩 , 李丝然 , 何昳頔 , 张佳 , 任金磊 , 吴志壕 , 刘峰 , 范中行 , 王鹏 , 吴海华 , 程炳琳 , 周辉 , 韩特 , 王颖昕 , 刘洋 , 孟元军
IPC分类号: G05D1/10
摘要: 零交互通信的飞行器集群协同搜索方法,利用目标阵型分布的信息,统计目标位置分布的数据,形成先验信息;初始化搜索经验池和搜索策略,并建立搜索任务交互环境;构建基于多智能体强化学习的飞行器集群协同搜索框架,智能体从环境中获得观测信息;为每个智能体构建内在奖励Q网络、外在奖励Q网络,为飞行器集群构建混合Q网络,进行学习训练;执行时,智能体依据局部的观察进行动作选择,满足大部分实际环境的现实约束。本发明解决了现有技术中存在的搜索空间大场景内奖励稀疏智能体难以获得奖励信号学习缓慢、搜索过程依赖通信和全局信息等问题。
-
-
-
-
-
-
-
-
-