专利检索 ap:("中国电子科技集团公司电子科学研究院" OR "绿盟科技集团股份有限公司" OR "北京神州绿盟科技有限公司") AND inv:"郭广宇" 第 1 页

1.

发明授权
一种多智能体的动作决策方法、装置、设备及存储介质有权

公开(公告)号：CN113872924B

公开(公告)日：2023-05-02

申请号：CN202010622063.6

申请日：2020-06-30

申请人： 中国电子科技集团公司电子科学研究院 , 绿盟科技集团股份有限公司 , 北京神州绿盟科技有限公司

发明人： 司瑞彬 , 顾杜娟 , 杨传安 , 王静平 , 李和聪 , 郭广宇 , 徐澄

IPC分类号： H04L9/40 , H04L67/12 , G06N3/02

摘要： 本申请提供一种多智能体的动作决策方法、装置、设备及存储介质，涉及人工智能技术领域，用于优化对多智能体的动作进行决策的过程。该方法包括：对多个节点的当前环境信息进行筛选，获得目标环境信息并发送给各节点；获取各节点的整合环境信息；一个节点的整合环境信息包括该节点基于接收的目标环境信息和历史信息且利用强化学习选取的待执行动作；历史信息包括该节点在历史时刻的节点类型及执行的动作，且是该节点从历史接收的目标环境信息中获得的；基于各节点的整合环境信息获取动作集合；从动作集合中选取部分节点的待执行动作，并根据选取的待执行动构建序列动作集，序列动作集中包括按照设定执行顺序排列后的选取的待执行动作。

2.

发明公开
一种多智能体的动作决策方法、装置、设备及存储介质有权

公开(公告)号：CN113872924A

公开(公告)日：2021-12-31

申请号：CN202010622063.6

申请日：2020-06-30

申请人： 中国电子科技集团公司电子科学研究院 , 绿盟科技集团股份有限公司 , 北京神州绿盟科技有限公司

发明人： 司瑞彬 , 顾杜娟 , 杨传安 , 王静平 , 李和聪 , 郭广宇 , 徐澄

IPC分类号： H04L29/06 , H04L29/08 , G06N3/02

摘要： 本申请提供一种多智能体的动作决策方法、装置、设备及存储介质，涉及人工智能技术领域，用于优化对多智能体的动作进行决策的过程。该方法包括：对多个节点的当前环境信息进行筛选，获得目标环境信息并发送给各节点；获取各节点的整合环境信息；一个节点的整合环境信息包括该节点基于接收的目标环境信息和历史信息且利用强化学习选取的待执行动作；历史信息包括该节点在历史时刻的节点类型及执行的动作，且是该节点从历史接收的目标环境信息中获得的；基于各节点的整合环境信息获取动作集合；从动作集合中选取部分节点的待执行动作，并根据选取的待执行动构建序列动作集，序列动作集中包括按照设定执行顺序排列后的选取的待执行动作。