-
公开(公告)号:CN112180724B
公开(公告)日:2022-06-03
申请号:CN202011029199.2
申请日:2020-09-25
IPC分类号: G05B13/04 , G05B13/02 , G05B19/418 , G06N20/00
摘要: 本发明公开了一种在干扰条件下多智能体协同合作的训练方法及系统,包括:基于构建的训练场景,在至少一个干扰智能体的信号干扰下,多个合作智能体利用各自通信功能连接通信范围内的合作智能体,构建合作智能体组;隶属于所述合作智能体组内的各合作智能体共享感知视野;基于共享的感知视野,以合作智能体组内的各智能体与环境交互的累计奖励最大为目标,利用多智能体深度确定性策略梯度MADDPG对每个智能体的行为策略进行训练,得到以阻止目标智能体到达目标区域为目的的多智能体协同合作策略。利用本发明提供的训练方法,当存在干扰时多个合作智能体利用各自通信功能连接通信范围内的合作智能体,通过共享感知视野有效阻止目标智能体到达目标区域。
-
公开(公告)号:CN112180724A
公开(公告)日:2021-01-05
申请号:CN202011029199.2
申请日:2020-09-25
IPC分类号: G05B13/04 , G05B13/02 , G05B19/418 , G06N20/00
摘要: 本发明公开了一种在干扰条件下多智能体协同合作的训练方法及系统,包括:基于构建的训练场景,在至少一个干扰智能体的信号干扰下,多个合作智能体利用各自通信功能连接通信范围内的合作智能体,构建合作智能体组;隶属于所述合作智能体组内的各合作智能体共享感知视野;基于共享的感知视野,以合作智能体组内的各智能体与环境交互的累计奖励最大为目标,利用多智能体深度确定性策略梯度MADDPG对每个智能体的行为策略进行训练,得到以阻止目标智能体到达目标区域为目的的多智能体协同合作策略。利用本发明提供的训练方法,当存在干扰时多个合作智能体利用各自通信功能连接通信范围内的合作智能体,通过共享感知视野有效阻止目标智能体到达目标区域。
-
公开(公告)号:CN112488320B
公开(公告)日:2023-05-02
申请号:CN202011024781.X
申请日:2020-09-25
摘要: 本发明提供了一种针对复杂条件下多智能体的训练方法及系统,包括:基于训练目标,构建训练场景和智能体模型;将所述训练场景按照场景复杂程度,由简单到复杂依次分解为多个课程任务;利用所述智能体模型,按场景复杂程度,依次选择课程任务进行训练得到各智能体的策略;其中在训练过程中将前一课程任务的训练结果作为下一课程任务的初始条件。本发明将训练场景按照场景复杂程度,由简单到复杂依次分解为多个课程任务,解决了多智能体强化学习中的非平稳问题,提升了训练效果,同时缩短了训练时间。
-
公开(公告)号:CN112113557B
公开(公告)日:2023-05-02
申请号:CN202010742633.5
申请日:2020-07-29
摘要: 本发明涉及一种基于插值法的多无人机相对定位预测方法及装置,包括:获取当前采样点无人机间的定位数据;根据当前采样点对应的采样点数据更新所述当前采样点无人机间的相对定位;根据当前采样点对应的采样点数和所述当前采样点无人机间的定位数据预测下一采样点无人机间的相对定位;本发明提供的技术方案,在GPS拒止环境下不依赖于任何外部基础设施,通过基于插值的数据增强方法,来提高多无人机在高速飞行应用场景中相对定位的精度,并深入分析该方法在多无人机同速飞行场景中出现的误差累积问题。
-
公开(公告)号:CN112488320A
公开(公告)日:2021-03-12
申请号:CN202011024781.X
申请日:2020-09-25
摘要: 本发明提供了一种针对复杂条件下多智能体的训练方法及系统,包括:基于训练目标,构建训练场景和智能体模型;将所述训练场景按照场景复杂程度,由简单到复杂依次分解为多个课程任务;利用所述智能体模型,按场景复杂程度,依次选择课程任务进行训练得到各智能体的策略;其中在训练过程中将前一课程任务的训练结果作为下一课程任务的初始条件。本发明将训练场景按照场景复杂程度,由简单到复杂依次分解为多个课程任务,解决了多智能体强化学习中的非平稳问题,提升了训练效果,同时缩短了训练时间。
-
公开(公告)号:CN112113557A
公开(公告)日:2020-12-22
申请号:CN202010742633.5
申请日:2020-07-29
摘要: 本发明涉及一种基于插值法的多无人机相对定位预测方法及装置,包括:获取当前采样点无人机间的定位数据;根据当前采样点对应的采样点数据更新所述当前采样点无人机间的相对定位;根据当前采样点对应的采样点数和所述当前采样点无人机间的定位数据预测下一采样点无人机间的相对定位;本发明提供的技术方案,在GPS拒止环境下不依赖于任何外部基础设施,通过基于插值的数据增强方法,来提高多无人机在高速飞行应用场景中相对定位的精度,并深入分析该方法在多无人机同速飞行场景中出现的误差累积问题。
-
-
-
-
-