一种基于深度强化学习的物流机器人调度方法

发明授权

请登陆查看更多内容

专利标题： 一种基于深度强化学习的物流机器人调度方法
申请号： CN202411009101.5

申请日： 2024-07-26
公开(公告)号： CN118536783B

公开(公告)日： 2024-11-01
发明人: 张亶 , 陈瑞豪 , 吴斌 , 李征 , 梁海明 , 葛婉琼 , 舒增文
申请人： 浙江大学
申请人地址： 浙江省杭州市西湖区余杭塘路866号
专利权人： 浙江大学
当前专利权人： 浙江大学
当前专利权人地址： 浙江省杭州市西湖区余杭塘路866号
代理机构： 杭州求是专利事务所有限公司
代理商 邱启旺
主分类号： G06Q10/0631
IPC分类号： G06Q10/0631 ; G06Q10/083 ; G06N3/0499 ; G06N3/048 ; G06N3/092

摘要：

本发明公开了一种基于深度强化学习的物流机器人调度方法。本方法包括：首先，构建并训练深度状态价值网络DVN，通过对历史订单数据进行离线学习，采用时序差分法更新状态价值函数，并通过多物流机器人深度强化学习方法优化调度策略；然后，通过DVN和KM组合优化算法实现物流机器人与订单的实时匹配；最终，调度空闲物流机器人前往预期收益较高的区域等待下一轮调度。本发明通过构建深度状态价值网络DVN和采用组合优化方法，实现医院物流机器人对物流订单的高效调度。本发明在提升订单响应速度和减少订单等待时间方面有显著优势，并且适用于各类医院场景，能够有效提高物流调度效率，优化资源配置。

公开/授权文献

CN118536783A 一种基于深度强化学习的物流机器人调度方法公开/授权日：2024-08-23

信息查询

中国专利公布公告 Global Dossier Espacenet