一种基于子空间感知的多智能体探索方法和设备

发明公开

CN117065354A 一种基于子空间感知的多智能体探索方法和设备审中-实审

请登陆查看更多内容

专利标题： 一种基于子空间感知的多智能体探索方法和设备
申请号： CN202310981366.0

申请日： 2023-08-04
公开(公告)号： CN117065354A

公开(公告)日： 2023-11-17
发明人: 张俊格 , 黄凯奇 , 徐沛
申请人： 中国科学院自动化研究所
申请人地址： 北京市海淀区中关村东路95号
专利权人： 中国科学院自动化研究所
当前专利权人： 中国科学院自动化研究所
当前专利权人地址： 北京市海淀区中关村东路95号
代理机构： 北京路浩知识产权代理有限公司
代理商 幸盼
主分类号： A63F13/67
IPC分类号： A63F13/67

摘要：

本发明提供一种基于子空间感知的多智能体探索方法和设备，该方法包括：获取多智能体与游戏仿真环境交互得到的多组仿真数据；从多组仿真数据中选取至少一组目标仿真数据，并确定每一组目标仿真数据中多智能体的输出动作分别对应不同维度的状态子空间的团队奖励；基于任意一组目标仿真数据中多智能体的输出动作分别对应不同维度的状态子空间的团队奖励，更新任意一组目标仿真数据中多智能体的输出动作对应的初始团队奖励；在各组目标仿真数据中多智能体的输出动作对应的初始团队奖励更新完成后，基于更新后的至少一组目标仿真数据，更新多智能体的参数，使得智能体的探索方向可以被控制，提高了多智能体的探索效率。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

A	人类生活必需
A63	运动；游戏；娱乐活动
A63F	纸牌，棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；视频游戏；其他类目不包含的游戏
A63F13/00	视频游戏，即使用二维或多维电子显示器的游戏
A63F13/60	.在执行游戏程序时或之前生成或修改游戏内容，如特别适合游戏开发或集成游戏关卡编辑器的创作工具
A63F13/67	..适应性的或通过向玩家的动作学习，例如技能水平的调整或重新使用存储成功的作战序列