一种基于SAC的水下机器人自主控制方法
Abstract:
本发明涉及水下机器人行为控制的技术领域,公开了一种基于SAC的水下机器人自主控制方法,包括:构建智能体分解模型,利用智能体分解模型将水下机器人分解为若干智能体;构建注意力图神经网络模型,将智能体状态映射为智能体依赖关系图;构建水下机器人控制策略模型;根据映射得到的智能体依赖关系图确定智能体执行动作的反馈收益,以智能体反馈收益为基础构建水下机器人控制策略模型的目标函数,并利用SAC算法对目标函数进行求解,得到水下机器人最优控制策略。本发明所述方法通过将水下机器人控制策略优化问题转换为多智能体控制策略优化问题,利用强化学习方法寻找智能体控制的最优策略,实现水下机器人的实时自主控制。
Public/Granted literature
Patent Agency Ranking
0/0