一种基于深度强化学习的边缘容器资源分配方法
摘要:
本发明公开了一种基于深度强化学习的边缘容器资源分配方法,包括Actor网络、Critic网络、回声状态网络ESN,有效的解决了时延敏感性应用的边缘计算环境的容器资源分配的问题。本发明提供的资源分配方法通过在M/D/1排队模型的基础上建立端到端时延模型,得到服务流s数据包在容器n上的端到端时延,为解决边缘容器资源分配的问题采用基于深度强化学习模型,并通过回声状态网络ESN改进传统A3C算法得到了一种时延敏感型应用的边缘容器的资源分配方法—EC-A3C网络,在资源池z为不同的容器集群Sz,t分配资源分配策略At,用以解决边缘计算环境的容器资源分配的问题,EC-A3C网络通过改变端到端时延的奖励值rt,以适应多种的边缘计算环境。
0/0