基于通信和多智能体强化学习的多车编队决策方法及系统
摘要:
本发明提供一种基于通信和多智能体强化学习的多车编队决策方法,面向不同的多车编队任务初始化对应的多车队形,基于多智能体强化学习QMIX算法利用神经网络搭建不同的多智能体决策模型;编队的每辆车辆中均设有若干个多智能体决策模型,每一个多智能体决策模型负责对应的编队任务;对于不同的编队任务分别设计对应的个体奖励函数和全局奖励函数;基于安全规则对本车进行安全动作空间筛选;基于奖励函数在编队场景中进行智能体决策模型的在线交互训练,优化智能体决策模型至完全收敛;对每一辆编队车辆,调用优化后的智能体决策模型,输出本车对应的分布最佳决策动作。本发明能提高对场景良好的泛化性。
0/0