- 专利标题: 一种在干扰条件下多智能体协同合作的训练方法及系统
-
申请号: CN202011029199.2申请日: 2020-09-25
-
公开(公告)号: CN112180724A公开(公告)日: 2021-01-05
- 发明人: 史殿习 , 张耀文 , 武云龙 , 张拥军 , 郝峰 , 佘馥江 , 徐天齐
- 申请人: 中国人民解放军军事科学院国防科技创新研究院 , 天津(滨海)人工智能军民融合创新中心
- 申请人地址: 北京市丰台区东大街53号院
- 专利权人: 中国人民解放军军事科学院国防科技创新研究院,天津(滨海)人工智能军民融合创新中心
- 当前专利权人: 中国人民解放军军事科学院国防科技创新研究院,天津(滨海)人工智能军民融合创新中心
- 当前专利权人地址: 北京市丰台区东大街53号院
- 代理机构: 北京安博达知识产权代理有限公司
- 代理商 徐国文
- 主分类号: G05B13/04
- IPC分类号: G05B13/04 ; G05B13/02 ; G05B19/418 ; G06N20/00
摘要:
本发明公开了一种在干扰条件下多智能体协同合作的训练方法及系统,包括:基于构建的训练场景,在至少一个干扰智能体的信号干扰下,多个合作智能体利用各自通信功能连接通信范围内的合作智能体,构建合作智能体组;隶属于所述合作智能体组内的各合作智能体共享感知视野;基于共享的感知视野,以合作智能体组内的各智能体与环境交互的累计奖励最大为目标,利用多智能体深度确定性策略梯度MADDPG对每个智能体的行为策略进行训练,得到以阻止目标智能体到达目标区域为目的的多智能体协同合作策略。利用本发明提供的训练方法,当存在干扰时多个合作智能体利用各自通信功能连接通信范围内的合作智能体,通过共享感知视野有效阻止目标智能体到达目标区域。
公开/授权文献
- CN112180724B 一种在干扰条件下多智能体协同合作的训练方法及系统 公开/授权日:2022-06-03