一种多AGV调度方法、装置、设备及存储介质
摘要:
本申请公开了一种多AGV调度方法、装置、设备及存储介质,涉及物流仓储技术领域。该方法包括:收集实时环境信息并通过深度编解码网络建模为实时环境状态表示;构建基于扩散模型和多智能体强化学习的多AGV动态调度模型并利用实时环境状态表示对多AGV动态调度模型进行训练,以得到目标多AGV动态调度模型;其中,扩散模型使用无分类器指导以及在预设低温范围内进行采样,以及基于去噪扩散概率模型的训练方式生成动作序列;多智能体强化学习采用集中训练和分散执行的训练框架;将目标环境信息动态输入目标多AGV动态调度模型,以动态输出多AGV的动作序列。通过本申请的技术方案,可以实现多AGV动态调度并提升多AGV调度的效率。
公开/授权文献
0/0