发明公开
- 专利标题: 基于通信和多智能体强化学习的多车编队决策方法及系统
-
申请号: CN202311620690.6申请日: 2023-11-28
-
公开(公告)号: CN117539254A公开(公告)日: 2024-02-09
- 发明人: 裴晓飞 , 杨哲 , 杨波
- 申请人: 武汉理工大学
- 申请人地址: 湖北省武汉市洪山区珞狮路122号
- 专利权人: 武汉理工大学
- 当前专利权人: 武汉理工大学
- 当前专利权人地址: 湖北省武汉市洪山区珞狮路122号
- 代理机构: 湖北武汉永嘉专利代理有限公司
- 代理商 王丹
- 主分类号: G05D1/43
- IPC分类号: G05D1/43 ; G05D1/633 ; G05D1/644 ; G05D1/693 ; G05D1/692 ; G05D1/648 ; G05D109/10
摘要:
本发明提供一种基于通信和多智能体强化学习的多车编队决策方法,面向不同的多车编队任务初始化对应的多车队形,基于多智能体强化学习QMIX算法利用神经网络搭建不同的多智能体决策模型;编队的每辆车辆中均设有若干个多智能体决策模型,每一个多智能体决策模型负责对应的编队任务;对于不同的编队任务分别设计对应的个体奖励函数和全局奖励函数;基于安全规则对本车进行安全动作空间筛选;基于奖励函数在编队场景中进行智能体决策模型的在线交互训练,优化智能体决策模型至完全收敛;对每一辆编队车辆,调用优化后的智能体决策模型,输出本车对应的分布最佳决策动作。本发明能提高对场景良好的泛化性。