一种基于深度强化学习的机器人自主寻源方法及装置
摘要:
本申请提供了一种基于深度强化学习的机器人自主寻源方法及装置。所述方法包括:建立放射源计数衰减模型和放射源计数分布模型;基于实际环境,建立寻源模拟环境,所述寻源模拟环境包括探测器、放射源和屏蔽物;基于所述放射源计数衰减模型和放射源计数分布模型,利用所述探测器在所述寻源模拟环境中沿着不同路径测量不同位置的所述放射源的放射性活度,并依据价值函数,确定探测器在每个状态下,不同动作对应的价值函数值,多次训练后以建立深度强化学习模型;基于所述深度强化学习模型,在实际环境中找到放射源。
0/0