专利检索 ap:("中国人民解放军军事科学院国防科技创新研究院" OR "天津(滨海)人工智能军民融合创新中心") AND inv:"徐天齐" 第 1 页

1.

发明授权
一种在干扰条件下多智能体协同合作的训练方法及系统有权

公开(公告)号：CN112180724B

公开(公告)日：2022-06-03

申请号：CN202011029199.2

申请日：2020-09-25

申请人： 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心

发明人： 史殿习 , 张耀文 , 武云龙 , 张拥军 , 郝峰 , 佘馥江 , 徐天齐

IPC分类号： G05B13/04 , G05B13/02 , G05B19/418 , G06N20/00

摘要： 本发明公开了一种在干扰条件下多智能体协同合作的训练方法及系统，包括：基于构建的训练场景，在至少一个干扰智能体的信号干扰下，多个合作智能体利用各自通信功能连接通信范围内的合作智能体，构建合作智能体组；隶属于所述合作智能体组内的各合作智能体共享感知视野；基于共享的感知视野，以合作智能体组内的各智能体与环境交互的累计奖励最大为目标，利用多智能体深度确定性策略梯度MADDPG对每个智能体的行为策略进行训练，得到以阻止目标智能体到达目标区域为目的的多智能体协同合作策略。利用本发明提供的训练方法，当存在干扰时多个合作智能体利用各自通信功能连接通信范围内的合作智能体，通过共享感知视野有效阻止目标智能体到达目标区域。

2.

发明公开
一种在干扰条件下多智能体协同合作的训练方法及系统有权

公开(公告)号：CN112180724A

公开(公告)日：2021-01-05

申请号：CN202011029199.2

申请日：2020-09-25

申请人： 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心

发明人： 史殿习 , 张耀文 , 武云龙 , 张拥军 , 郝峰 , 佘馥江 , 徐天齐

IPC分类号： G05B13/04 , G05B13/02 , G05B19/418 , G06N20/00

摘要： 本发明公开了一种在干扰条件下多智能体协同合作的训练方法及系统，包括：基于构建的训练场景，在至少一个干扰智能体的信号干扰下，多个合作智能体利用各自通信功能连接通信范围内的合作智能体，构建合作智能体组；隶属于所述合作智能体组内的各合作智能体共享感知视野；基于共享的感知视野，以合作智能体组内的各智能体与环境交互的累计奖励最大为目标，利用多智能体深度确定性策略梯度MADDPG对每个智能体的行为策略进行训练，得到以阻止目标智能体到达目标区域为目的的多智能体协同合作策略。利用本发明提供的训练方法，当存在干扰时多个合作智能体利用各自通信功能连接通信范围内的合作智能体，通过共享感知视野有效阻止目标智能体到达目标区域。

3.

发明授权
一种针对复杂条件下多智能体的训练方法及系统有权

公开(公告)号：CN112488320B

公开(公告)日：2023-05-02

申请号：CN202011024781.X

申请日：2020-09-25

申请人： 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心

发明人： 史殿习 , 张耀文 , 张拥军 , 武云龙 , 秦伟 , 徐天齐 , 王功举

IPC分类号： G06N20/00 , H04K3/00

摘要： 本发明提供了一种针对复杂条件下多智能体的训练方法及系统，包括：基于训练目标，构建训练场景和智能体模型；将所述训练场景按照场景复杂程度，由简单到复杂依次分解为多个课程任务；利用所述智能体模型，按场景复杂程度，依次选择课程任务进行训练得到各智能体的策略；其中在训练过程中将前一课程任务的训练结果作为下一课程任务的初始条件。本发明将训练场景按照场景复杂程度，由简单到复杂依次分解为多个课程任务，解决了多智能体强化学习中的非平稳问题，提升了训练效果，同时缩短了训练时间。

4.

发明授权
一种基于插值法的多无人机相对定位预测方法及装置有权

公开(公告)号：CN112113557B

公开(公告)日：2023-05-02

申请号：CN202010742633.5

申请日：2020-07-29

申请人： 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心

发明人： 张拥军 , 佘馥江 , 史殿习 , 任小广 , 周浩 , 徐天齐

IPC分类号： G01C21/00 , G01C21/16

摘要： 本发明涉及一种基于插值法的多无人机相对定位预测方法及装置，包括：获取当前采样点无人机间的定位数据；根据当前采样点对应的采样点数据更新所述当前采样点无人机间的相对定位；根据当前采样点对应的采样点数和所述当前采样点无人机间的定位数据预测下一采样点无人机间的相对定位；本发明提供的技术方案，在GPS拒止环境下不依赖于任何外部基础设施，通过基于插值的数据增强方法，来提高多无人机在高速飞行应用场景中相对定位的精度，并深入分析该方法在多无人机同速飞行场景中出现的误差累积问题。

5.

发明公开
一种针对复杂条件下多智能体的训练方法及系统有权

公开(公告)号：CN112488320A

公开(公告)日：2021-03-12

申请号：CN202011024781.X

申请日：2020-09-25

申请人： 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心

发明人： 史殿习 , 张耀文 , 张拥军 , 武云龙 , 秦伟 , 徐天齐 , 王功举

IPC分类号： G06N20/00 , H04K3/00

摘要： 本发明提供了一种针对复杂条件下多智能体的训练方法及系统，包括：基于训练目标，构建训练场景和智能体模型；将所述训练场景按照场景复杂程度，由简单到复杂依次分解为多个课程任务；利用所述智能体模型，按场景复杂程度，依次选择课程任务进行训练得到各智能体的策略；其中在训练过程中将前一课程任务的训练结果作为下一课程任务的初始条件。本发明将训练场景按照场景复杂程度，由简单到复杂依次分解为多个课程任务，解决了多智能体强化学习中的非平稳问题，提升了训练效果，同时缩短了训练时间。

6.

发明公开
一种基于插值法的多无人机相对定位预测方法及装置有权

公开(公告)号：CN112113557A

公开(公告)日：2020-12-22

申请号：CN202010742633.5

申请日：2020-07-29

申请人： 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心

发明人： 张拥军 , 佘馥江 , 史殿习 , 任小广 , 周浩 , 徐天齐

IPC分类号： G01C21/00 , G01C21/16

摘要： 本发明涉及一种基于插值法的多无人机相对定位预测方法及装置，包括：获取当前采样点无人机间的定位数据；根据当前采样点对应的采样点数据更新所述当前采样点无人机间的相对定位；根据当前采样点对应的采样点数和所述当前采样点无人机间的定位数据预测下一采样点无人机间的相对定位；本发明提供的技术方案，在GPS拒止环境下不依赖于任何外部基础设施，通过基于插值的数据增强方法，来提高多无人机在高速飞行应用场景中相对定位的精度，并深入分析该方法在多无人机同速飞行场景中出现的误差累积问题。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类