- 专利标题: 一种基于深度强化学习的机器人自主寻源方法及装置
-
申请号: CN202110968071.0申请日: 2021-08-23
-
公开(公告)号: CN113721613B公开(公告)日: 2023-05-23
- 发明人: 王泽宇 , 龚频 , 汤晓斌 , 吴孙慈 , 王鹏 , 胡志猛 , 梁大戬 , 周程 , 蒋若澄
- 申请人: 南京航空航天大学
- 申请人地址: 江苏省南京市御道街29号
- 专利权人: 南京航空航天大学
- 当前专利权人: 南京航空航天大学
- 当前专利权人地址: 江苏省南京市御道街29号
- 代理机构: 北京邦中知识产权代理有限公司
- 代理商 方岩; 张君
- 主分类号: G05D1/02
- IPC分类号: G05D1/02
摘要:
本申请提供了一种基于深度强化学习的机器人自主寻源方法及装置。所述方法包括:建立放射源计数衰减模型和放射源计数分布模型;基于实际环境,建立寻源模拟环境,所述寻源模拟环境包括探测器、放射源和屏蔽物;基于所述放射源计数衰减模型和放射源计数分布模型,利用所述探测器在所述寻源模拟环境中沿着不同路径测量不同位置的所述放射源的放射性活度,并依据价值函数,确定探测器在每个状态下,不同动作对应的价值函数值,多次训练后以建立深度强化学习模型;基于所述深度强化学习模型,在实际环境中找到放射源。
公开/授权文献
- CN113721613A 一种基于深度强化学习的机器人自主寻源方法及装置 公开/授权日:2021-11-30