基于通信和多智能体强化学习的多车编队决策方法及系统

发明公开

CN117539254A 基于通信和多智能体强化学习的多车编队决策方法及系统审中-实审

请登陆查看更多内容

专利标题： 基于通信和多智能体强化学习的多车编队决策方法及系统
申请号： CN202311620690.6

申请日： 2023-11-28
公开(公告)号： CN117539254A

公开(公告)日： 2024-02-09
发明人: 裴晓飞 , 杨哲 , 杨波
申请人： 武汉理工大学
申请人地址： 湖北省武汉市洪山区珞狮路122号
专利权人： 武汉理工大学
当前专利权人： 武汉理工大学
当前专利权人地址： 湖北省武汉市洪山区珞狮路122号
代理机构： 湖北武汉永嘉专利代理有限公司
代理商 王丹
主分类号： G05D1/43
IPC分类号： G05D1/43 ; G05D1/633 ; G05D1/644 ; G05D1/693 ; G05D1/692 ; G05D1/648 ; G05D109/10

摘要：

本发明提供一种基于通信和多智能体强化学习的多车编队决策方法，面向不同的多车编队任务初始化对应的多车队形，基于多智能体强化学习QMIX算法利用神经网络搭建不同的多智能体决策模型；编队的每辆车辆中均设有若干个多智能体决策模型，每一个多智能体决策模型负责对应的编队任务；对于不同的编队任务分别设计对应的个体奖励函数和全局奖励函数；基于安全规则对本车进行安全动作空间筛选；基于奖励函数在编队场景中进行智能体决策模型的在线交互训练，优化智能体决策模型至完全收敛；对每一辆编队车辆，调用优化后的智能体决策模型，输出本车对应的分布最佳决策动作。本发明能提高对场景良好的泛化性。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet