- 专利标题: 一种基于深度强化学习的物流机器人调度方法
-
申请号: CN202411009101.5申请日: 2024-07-26
-
公开(公告)号: CN118536783B公开(公告)日: 2024-11-01
- 发明人: 张亶 , 陈瑞豪 , 吴斌 , 李征 , 梁海明 , 葛婉琼 , 舒增文
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 邱启旺
- 主分类号: G06Q10/0631
- IPC分类号: G06Q10/0631 ; G06Q10/083 ; G06N3/0499 ; G06N3/048 ; G06N3/092
摘要:
本发明公开了一种基于深度强化学习的物流机器人调度方法。本方法包括:首先,构建并训练深度状态价值网络DVN,通过对历史订单数据进行离线学习,采用时序差分法更新状态价值函数,并通过多物流机器人深度强化学习方法优化调度策略;然后,通过DVN和KM组合优化算法实现物流机器人与订单的实时匹配;最终,调度空闲物流机器人前往预期收益较高的区域等待下一轮调度。本发明通过构建深度状态价值网络DVN和采用组合优化方法,实现医院物流机器人对物流订单的高效调度。本发明在提升订单响应速度和减少订单等待时间方面有显著优势,并且适用于各类医院场景,能够有效提高物流调度效率,优化资源配置。
公开/授权文献
- CN118536783A 一种基于深度强化学习的物流机器人调度方法 公开/授权日:2024-08-23