-
公开(公告)号:CN113872924B
公开(公告)日:2023-05-02
申请号:CN202010622063.6
申请日:2020-06-30
申请人: 中国电子科技集团公司电子科学研究院 , 绿盟科技集团股份有限公司 , 北京神州绿盟科技有限公司
摘要: 本申请提供一种多智能体的动作决策方法、装置、设备及存储介质,涉及人工智能技术领域,用于优化对多智能体的动作进行决策的过程。该方法包括:对多个节点的当前环境信息进行筛选,获得目标环境信息并发送给各节点;获取各节点的整合环境信息;一个节点的整合环境信息包括该节点基于接收的目标环境信息和历史信息且利用强化学习选取的待执行动作;历史信息包括该节点在历史时刻的节点类型及执行的动作,且是该节点从历史接收的目标环境信息中获得的;基于各节点的整合环境信息获取动作集合;从动作集合中选取部分节点的待执行动作,并根据选取的待执行动构建序列动作集,序列动作集中包括按照设定执行顺序排列后的选取的待执行动作。
-
公开(公告)号:CN113872924A
公开(公告)日:2021-12-31
申请号:CN202010622063.6
申请日:2020-06-30
申请人: 中国电子科技集团公司电子科学研究院 , 绿盟科技集团股份有限公司 , 北京神州绿盟科技有限公司
摘要: 本申请提供一种多智能体的动作决策方法、装置、设备及存储介质,涉及人工智能技术领域,用于优化对多智能体的动作进行决策的过程。该方法包括:对多个节点的当前环境信息进行筛选,获得目标环境信息并发送给各节点;获取各节点的整合环境信息;一个节点的整合环境信息包括该节点基于接收的目标环境信息和历史信息且利用强化学习选取的待执行动作;历史信息包括该节点在历史时刻的节点类型及执行的动作,且是该节点从历史接收的目标环境信息中获得的;基于各节点的整合环境信息获取动作集合;从动作集合中选取部分节点的待执行动作,并根据选取的待执行动构建序列动作集,序列动作集中包括按照设定执行顺序排列后的选取的待执行动作。
-