一种基于深度强化学习的边缘容器资源分配方法

发明公开

CN111885137A 一种基于深度强化学习的边缘容器资源分配方法有权

请登陆查看更多内容

专利标题： 一种基于深度强化学习的边缘容器资源分配方法
申请号： CN202010682703.2

申请日： 2020-07-15
公开(公告)号： CN111885137A

公开(公告)日： 2020-11-03
发明人: 金翼 , 陆继钊 , 郭少勇 , 李文萃 , 吴晨光 , 王丰宁 , 贺文晨 , 邵苏杰 , 蔡沛霖 , 梅林 , 李永杰
申请人： 国网河南省电力公司信息通信公司 , 北京邮电大学 , 国家电网有限公司
申请人地址： 河南省郑州市二七区嵩山南路87号院办公区C楼
专利权人： 国网河南省电力公司信息通信公司,北京邮电大学,国家电网有限公司
当前专利权人： 国网河南省电力公司信息通信公司,北京邮电大学,国家电网有限公司
当前专利权人地址： 河南省郑州市二七区嵩山南路87号院办公区C楼
代理机构： 郑州博派知识产权代理事务所
代理商 邓小颖
主分类号： H04L29/08
IPC分类号： H04L29/08 ; G06F9/455 ; G06F9/50 ; G06N20/00

摘要：

本发明公开了一种基于深度强化学习的边缘容器资源分配方法，包括Actor网络、Critic网络、回声状态网络ESN，有效的解决了时延敏感性应用的边缘计算环境的容器资源分配的问题。本发明提供的资源分配方法通过在M/D/1排队模型的基础上建立端到端时延模型，得到服务流s数据包在容器n上的端到端时延，为解决边缘容器资源分配的问题采用基于深度强化学习模型，并通过回声状态网络ESN改进传统A3C算法得到了一种时延敏感型应用的边缘容器的资源分配方法—EC-A3C网络，在资源池z为不同的容器集群Sz，t分配资源分配策略At，用以解决边缘计算环境的容器资源分配的问题，EC-A3C网络通过改变端到端时延的奖励值rt，以适应多种的边缘计算环境。

公开/授权文献

CN111885137B 一种基于深度强化学习的边缘容器资源分配方法公开/授权日：2022-08-02

信息查询

中国专利公布公告 Global Dossier Espacenet