基于深度强化学习的放射性废物推抓协同分拣方法

    公开(公告)号:CN110400345B

    公开(公告)日:2021-06-15

    申请号:CN201910673482.X

    申请日:2019-07-24

    Abstract: 本发明公开了一种基于深度强化学习的放射性废物推抓协同分拣方法,其包括采用RGB‑D相机和γ相机分别采集待分拣对象的图像信息,并将所有的图像信息分别转换为初始状态图;将每张初始状态图旋转16次得到若干旋转状态图;将旋转状态图中的彩色图像和深度图像输入已训练的抓取操作全卷积网络和已训练的推动操作全卷积网络中得到张像素点Q值图;获取所有像素点Q值图中Q值最大的像素点,根据Q值最大的像素点控制机械臂执行作业,根据作业结果给予作业奖励;根据作业奖励计算损失函数,并更新输出Q值最大的像素点对应的像素点Q值图网络的网络参数;判断待分拣对象是否分拣完成,若是,则结束分拣,否则返回步获取图像信息。

    基于深度强化学习的放射性废物推抓协同分拣方法

    公开(公告)号:CN110400345A

    公开(公告)日:2019-11-01

    申请号:CN201910673482.X

    申请日:2019-07-24

    Abstract: 本发明公开了一种基于深度强化学习的放射性废物推抓协同分拣方法,其包括采用RGB-D相机和γ相机分别采集待分拣对象的图像信息,并将所有的图像信息分别转换为初始状态图;将每张初始状态图旋转16次得到若干旋转状态图;将旋转状态图中的彩色图像和深度图像输入已训练的抓取操作全卷积网络和已训练的推动操作全卷积网络中得到张像素点Q值图;获取所有像素点Q值图中Q值最大的像素点,根据Q值最大的像素点控制机械臂执行作业,根据作业结果给予作业奖励;根据作业奖励计算损失函数,并更新输出Q值最大的像素点对应的像素点Q值图网络的网络参数;判断待分拣对象是否分拣完成,若是,则结束分拣,否则返回步获取图像信息。

Patent Agency Ranking