• 专利标题: 基于深度双Q网络强化学习的UUV实时避碰规划方法
  • 专利标题(英): UUV real-time collision avoidance planning method based on deep double-Q network reinforcement learning
  • 申请号: CN201910934538.2
    申请日: 2019-09-29
  • 公开(公告)号: CN110716575A
    公开(公告)日: 2020-01-21
  • 发明人: 王宏健袁建亚严浙平贺巨义刘超伟牛韶源
  • 申请人: 哈尔滨工程大学
  • 申请人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • 专利权人: 哈尔滨工程大学
  • 当前专利权人: 哈尔滨工程大学
  • 当前专利权人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
  • 主分类号: G05D1/06
  • IPC分类号: G05D1/06
基于深度双Q网络强化学习的UUV实时避碰规划方法
摘要:
本发明属于UUV控制技术领域,具体涉及一种基于深度双Q网络强化学习的UUV实时避碰规划方法。本发明提供了一种适用于UUV工作环境和感知特点的自主避碰规划方法,通过UUV与环境之间不断地试错交互,利用成功或失败的经验,产生奖励或惩罚的信号不断地改进UUV的策略,让UUV具有自我学习的能力。本发明使网络体系在复杂环境的局部避碰规划时具有自我学习的能力实现端到端模型,通过直接从原始数据集上学习状态与动作的映射关系,将深度学习和强化学习相结合应用到避碰规划问题的解决上。本发明使用深度强化学习,不会因为路径过于复杂而无法执行策略,使其在实际应用中缩短了项目的开发周期、实施更加简洁、高效、鲁棒性高。
0/0