一种基于深度强化学习的机器人自主寻源方法及装置

发明授权

CN113721613B 一种基于深度强化学习的机器人自主寻源方法及装置有权

请登陆查看更多内容

专利标题： 一种基于深度强化学习的机器人自主寻源方法及装置
申请号： CN202110968071.0

申请日： 2021-08-23
公开(公告)号： CN113721613B

公开(公告)日： 2023-05-23
发明人: 王泽宇 , 龚频 , 汤晓斌 , 吴孙慈 , 王鹏 , 胡志猛 , 梁大戬 , 周程 , 蒋若澄
申请人： 南京航空航天大学
申请人地址： 江苏省南京市御道街29号
专利权人： 南京航空航天大学
当前专利权人： 南京航空航天大学
当前专利权人地址： 江苏省南京市御道街29号
代理机构： 北京邦中知识产权代理有限公司
代理商 方岩; 张君
主分类号： G05D1/02
IPC分类号： G05D1/02

摘要：

本申请提供了一种基于深度强化学习的机器人自主寻源方法及装置。所述方法包括：建立放射源计数衰减模型和放射源计数分布模型；基于实际环境，建立寻源模拟环境，所述寻源模拟环境包括探测器、放射源和屏蔽物；基于所述放射源计数衰减模型和放射源计数分布模型，利用所述探测器在所述寻源模拟环境中沿着不同路径测量不同位置的所述放射源的放射性活度，并依据价值函数，确定探测器在每个状态下，不同动作对应的价值函数值，多次训练后以建立深度强化学习模型；基于所述深度强化学习模型，在实际环境中找到放射源。

公开/授权文献

CN113721613A 一种基于深度强化学习的机器人自主寻源方法及装置公开/授权日：2021-11-30

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G05	控制；调节
G05D	非电变量的控制或调节系统（金属的连续铸造入B22D11/16；阀门本身入F16K；非电变量的检测见G01各有关小类；电或磁变量的调节入G05F）
G05D1/00	陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪（无线电导航系统或使用其他波的类似系统入G01S）
G05D1/02	.二维的位置或航道控制