基于低阶高斯分布的多智能体协同探索方法及装置

发明授权

CN112215333B 基于低阶高斯分布的多智能体协同探索方法及装置有权

请登陆查看更多内容

专利标题： 基于低阶高斯分布的多智能体协同探索方法及装置
申请号： CN202010962997.4

申请日： 2020-09-14
公开(公告)号： CN112215333B

公开(公告)日： 2022-08-12
发明人: 马骁腾 , 杨以钦 , 陆逸文 , 莫一林 , 赵千川
申请人： 清华大学
申请人地址： 北京市海淀区清华园
专利权人： 清华大学
当前专利权人： 清华大学
当前专利权人地址： 北京市海淀区清华园
代理机构： 北京清亦华知识产权代理事务所
代理商 张大威
主分类号： G06N3/04
IPC分类号： G06N3/04 ; G06N3/08

摘要：

本发明公开了一种基于低阶高斯分布的多智能体协同探索方法及装置，其中，该方法包括：获取多智能体决策下的状态轨迹，将状态轨迹存入数据缓存器；构建各个智能体的主值网络、各个智能体的主策略网络、QMIX主值网络、主协同探索网络、各个智能体的副值网络、各个智能体的副策略网络、QMIX副值网络、副协同探索网络；基于状态轨迹和值函数分解算法的多智能体协同探索过程，对上述构建的相关网络进行更新；根据更新的多个网络生成更新后的策略模型，对策略模型进行测试。该方法设计出一种在连续控制量的仿真环境中基于低阶高斯分布的多智能体协同探索算法。

公开/授权文献

CN112215333A 基于低阶高斯分布的多智能体协同探索方法及装置公开/授权日：2021-01-12

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N3/00	基于生物学模型的计算机系统
G06N3/02	.采用神经网络模型
G06N3/04	..体系结构，例如，互连拓扑