分离式内存架构下的混合远内存调度方法

    公开(公告)号:CN115495246A

    公开(公告)日:2022-12-20

    申请号:CN202211212624.0

    申请日:2022-09-30

    Abstract: 一种分离式内存架构下的混合远内存调度方法,首先通过限制应用本地内存使用的方式收集运行时数据,从而将任务分为远内存不敏感型任务、远内存敏感型任务和远内存禁止使用型任务;根据敏感程度互补原则,将内存不敏感型任务和内存敏感型任务分配到同一个计算节点,根据任务在同等性能限制条件下的最大可让出内存,当对应的服务器之间的整体可出让内存值相差较大时进行跨节点的内存资源调整,确定服务器的出让的内存值或者租借的远内存值,之后进行节点内部的内存资源调整,根据服务器的当前剩余内存资源,按照敏感型任务更多额外本地内存资源的原则,为每个任务进行资源分配,实现混合远内存调度。本发明充分挖掘应用在远内存环境下的特点,继而通过高效的远内存分配策略,提升数据中心中的内存利用率和使用效率。

    基于细粒度场景拆分的云游戏负载调度方法及系统

    公开(公告)号:CN118304641A

    公开(公告)日:2024-07-09

    申请号:CN202410496068.7

    申请日:2024-04-24

    Inventor: 李超 王靖 汪陶磊

    Abstract: 一种基于细粒度场景拆分的云游戏负载调度方法及系统,将云游戏阶段划分为不同阶段并通过判断当前任务所处的加载阶段,根据该游戏已运行阶段信息,通过机器学习预测下一阶段和对应的资源使用率及时长,在此基础上调度云游戏。本发明通过细化云游戏任务阶段,如:不同资源使用情况,不同用户影响性,从更细粒度的层面对于云游戏任务进行划分,结合历史数据进行预测,充分利用历史数据与游戏负载自身特性,通过云游戏场景和云游戏资源簇的比较,将游戏划分为不同阶段并判断用户所处的阶段,合理预测下一阶段的资源利用率情况,增加预测的准确性,更细粒度地调度云游戏任务,提高游戏吞吐量。

    分离式内存架构下的混合远内存调度方法

    公开(公告)号:CN115495246B

    公开(公告)日:2023-04-18

    申请号:CN202211212624.0

    申请日:2022-09-30

    Abstract: 一种分离式内存架构下的混合远内存调度方法,首先通过限制应用本地内存使用的方式收集运行时数据,从而将任务分为远内存不敏感型任务、远内存敏感型任务和远内存禁止使用型任务;根据敏感程度互补原则,将内存不敏感型任务和内存敏感型任务分配到同一个计算节点,根据任务在同等性能限制条件下的最大可让出内存,当对应的服务器之间的整体可出让内存值相差较大时进行跨节点的内存资源调整,确定服务器的出让的内存值或者租借的远内存值,之后进行节点内部的内存资源调整,根据服务器的当前剩余内存资源,按照敏感型任务更多额外本地内存资源的原则,为每个任务进行资源分配,实现混合远内存调度。本发明充分挖掘应用在远内存环境下的特点,继而通过高效的远内存分配策略,提升数据中心中的内存利用率和使用效率。

    分离可组合式架构下的图计算工作集优化实现方法及系统

    公开(公告)号:CN112817767B

    公开(公告)日:2021-11-16

    申请号:CN202110209494.4

    申请日:2021-02-24

    Abstract: 一种分离可组合式架构下的图计算工作集优化实现方法及系统,以数据段为单位,对待处理的图计算任务进行数据段识别;将图计算数据段按照四象限法划分为四大集合,进而根据读写访问热度进一步将四个集合划分为热工作集,即不可迁移工作集和冷工作集,即可迁移工作集;自动化调节可迁移工作集的本地与远程比例,根据图计算遍历过程中边数据只读不写的特性,向远程内存阶段进行单边远内存访问并读回索引所对应的数据块,实现灵活地将图计算任务的部分运行时数据拓展到远程内存资源。

    分离可组合式架构下的远内存访问优化方法及系统

    公开(公告)号:CN112817887B

    公开(公告)日:2021-09-17

    申请号:CN202110209483.6

    申请日:2021-02-24

    Abstract: 一种分离可组合式架构下的远内存访问优化方法及系统,首先按照应用的内存读写频率将可写工作集部署在本地计算节点,将只读工作集部署在远端内存节点上;在数据传输的过程中根据硬件资源特征选取合适的默认数据块大小,通过将数据块设置索引,结合RDMA传输过程动态分块实现数据块的透明分散和整合;利用单边读写和基于队列的RDMA机制实现配合本地应用读写的双向单边操作机制;利用基于事件通知的异步读写机制设置缓冲区实现本地计算和RDMA数据读写的异步并行处理。本发明可以充分挖掘应用层计算任务使用RDMA访问远内存的性能潜力。

    基于历史嵌入缓存的单机图神经网络优化方法及系统

    公开(公告)号:CN119761444A

    公开(公告)日:2025-04-04

    申请号:CN202411917589.1

    申请日:2024-12-24

    Abstract: 一种基于历史嵌入缓存的单机图神经网络优化方法及系统,通过对训练数据集进行预先采样分析收集采样数据,结合启发式方法计算得到每一层级历史嵌入缓存大小后,根据计算得到的各层级历史嵌入缓存大小设置缓存,并执行预采样,即循环进行基于子图的采样:每次采样过程中模拟缓存替换,进行子图剪枝并得到节点访问序列和子图拓扑连接关系,经重复若干次采样得到对应个数的训练子图后,计算若干步最优特征缓存替换并保存最优特征缓存替换信息;当加载训练子图进行实际训练时,每轮训练时结合采样子图进行历史嵌入推送/拉取,并结合最优特征缓存替换信息进行底层特征缓存替换后,实现单机图神经网络优化。

    多请求并发的GPU图随机游走优化实现方法及系统

    公开(公告)号:CN116188239B

    公开(公告)日:2023-09-12

    申请号:CN202211536501.2

    申请日:2022-12-02

    Abstract: 一种多请求并发的GPU图随机游走优化实现方法及系统,在离线阶段对图随机游走请求分类并正对各个请求的GPU资源占用情况,建立基于图随机游走请求类型和资源占用情况的并发效果判断机制;在在线阶段通过调度器预测图随机游走请求执行时间并根据各个图随机游走请求的适合度调整运行优先级和/或运行组合,通过GPU内存存储层级及多加速器端进行图数据切分管理和图随机游走请求执行。本发明能够实现低干扰、低延迟的图数据切分管理及低停顿的图随机游走请求执行,充分挖掘多GPU空分共享同时处理多并发请求的性能潜力,提高GPU上运行图随机游走请求的整体吞吐率,并降低能耗。

    多请求并发的GPU图随机游走优化实现方法及系统

    公开(公告)号:CN116188239A

    公开(公告)日:2023-05-30

    申请号:CN202211536501.2

    申请日:2022-12-02

    Abstract: 一种多请求并发的GPU图随机游走优化实现方法及系统,在离线阶段对图随机游走请求分类并正对各个请求的GPU资源占用情况,建立基于图随机游走请求类型和资源占用情况的并发效果判断机制;在在线阶段通过调度器预测图随机游走请求执行时间并根据各个图随机游走请求的适合度调整运行优先级和/或运行组合,通过GPU内存存储层级及多加速器端进行图数据切分管理和图随机游走请求执行。本发明能够实现低干扰、低延迟的图数据切分管理及低停顿的图随机游走请求执行,充分挖掘多GPU空分共享同时处理多并发请求的性能潜力,提高GPU上运行图随机游走请求的整体吞吐率,并降低能耗。

    分离可组合式架构下的远内存访问优化方法及系统

    公开(公告)号:CN112817887A

    公开(公告)日:2021-05-18

    申请号:CN202110209483.6

    申请日:2021-02-24

    Abstract: 一种分离可组合式架构下的远内存访问优化方法及系统,首先按照应用的内存读写频率将可写工作集部署在本地计算节点,将只读工作集部署在远端内存节点上;在数据传输的过程中根据硬件资源特征选取合适的默认数据块大小,通过将数据块设置索引,结合RDMA传输过程动态分块实现数据块的透明分散和整合;利用单边读写和基于队列的RDMA机制实现配合本地应用读写的双向单边操作机制;利用基于事件通知的异步读写机制设置缓冲区实现本地计算和RDMA数据读写的异步并行处理。本发明可以充分挖掘应用层计算任务使用RDMA访问远内存的性能潜力。

    分离可组合式架构下的图计算工作集优化实现方法及系统

    公开(公告)号:CN112817767A

    公开(公告)日:2021-05-18

    申请号:CN202110209494.4

    申请日:2021-02-24

    Abstract: 一种分离可组合式架构下的图计算工作集优化实现方法及系统,以数据段为单位,对待处理的图计算任务进行数据段识别;将图计算数据段按照四象限法划分为四大集合,进而根据读写访问热度进一步将四个集合划分为热工作集,即不可迁移工作集和冷工作集,即可迁移工作集;自动化调节可迁移工作集的本地与远程比例,根据图计算遍历过程中边数据只读不写的特性,向远程内存阶段进行单边远内存访问并读回索引所对应的数据块,实现灵活地将图计算任务的部分运行时数据拓展到远程内存资源。

Patent Agency Ranking