一种在干扰条件下多智能体协同合作的训练方法及系统
摘要:
本发明公开了一种在干扰条件下多智能体协同合作的训练方法及系统,包括:基于构建的训练场景,在至少一个干扰智能体的信号干扰下,多个合作智能体利用各自通信功能连接通信范围内的合作智能体,构建合作智能体组;隶属于所述合作智能体组内的各合作智能体共享感知视野;基于共享的感知视野,以合作智能体组内的各智能体与环境交互的累计奖励最大为目标,利用多智能体深度确定性策略梯度MADDPG对每个智能体的行为策略进行训练,得到以阻止目标智能体到达目标区域为目的的多智能体协同合作策略。利用本发明提供的训练方法,当存在干扰时多个合作智能体利用各自通信功能连接通信范围内的合作智能体,通过共享感知视野有效阻止目标智能体到达目标区域。
0/0