Invention Grant
- Patent Title: 一种基于状态分类与指派的多Agent深度强化学习系统及方法
-
Application No.: CN202211182519.7Application Date: 2022-09-27
-
Publication No.: CN115563527BPublication Date: 2023-06-16
- Inventor: 徐进 , 补金凤
- Applicant: 西南交通大学
- Applicant Address: 四川省成都市二环路北一段111号
- Assignee: 西南交通大学
- Current Assignee: 西南交通大学
- Current Assignee Address: 四川省成都市二环路北一段111号
- Agency: 成都智言知识产权代理有限公司
- Agent 蒋秀清
- Main IPC: G06F18/24
- IPC: G06F18/24 ; G06F18/23213 ; G06N3/006
Abstract:
本发明属于人工智能领域,具体涉及一种基于状态分类与指派的多agent深度强化学习框架及方法。包括:执行M1,对生成的环境虚拟状态样本进行分类,并求解一个指派问题,得到状态分类模型F和agent的指派规则A;设置Multi‑Agents中的所有agent的网络结构,以及它们的学习模式、行动选择策略、更新方式和reward的计算方法;执行M2,首先初始化多个符合上述步骤设置的同质agent,然后初始化环境,最后多个agent与环境交互,学习行动策略,并更新各自的网络。本发明中将复杂的环境状态分解为简单易学习多个状态空间,并可以将多个agent指派到多个状态空间,克服单个agent面对人工划分的局部状态或者全局状态时学习效率低的缺陷,最终实现MADRL整体学习效果的提升。
Public/Granted literature
- CN115563527A 一种基于状态分类与指派的多Agent深度强化学习框架及方法 Public/Granted day:2023-01-03
Information query