一种基于好奇心机制的边缘云系统调度方法

    公开(公告)号:CN118051306A

    公开(公告)日:2024-05-17

    申请号:CN202410017359.3

    申请日:2024-01-05

    申请人: 天津大学

    摘要: 本发明公开了一种基于好奇心机制的边缘云系统调度方法,涉及互联网调度领域,通过采用小时间尺度的多智能体行动者‑评论者算法MAA2C进行请求调度以及大时间尺度的图卷积网络‑行动者‑评论者算法GCN‑A2C进行服务编排;在MAA2C和GCN‑A2C强化学习算法中添加内在好奇心模块ICM,ICM模块包括前向模型forward model和逆向模型inverse model两个组件;前向模型负责预测智能体在不同动作下的下一个状态,逆向模型负责预测智能体应该采取的动作,实现从当前状态到目标状态的转移;ICM模块在强化学习框架中引入内在奖励机制;使用多智能体强化学习MARL使得边缘云调度器能够在互动环境中学习,有效处理复杂的协同决策问题。本发明采用上述的调度方法,提升了系统的效率和稳定性。