-
公开(公告)号:CN109522108A
公开(公告)日:2019-03-26
申请号:CN201811279163.2
申请日:2018-10-30
申请人: 西安交通大学
摘要: 本发明公开了一种基于Kernel合并的GPU多任务调度系统及方法。包括任务分析模块、Kernel合并模块、任务调度模块和任务存储队列。用户提交GPU任务至任务存储队列,任务分析模块计算任务间的合并加速比,任务调度模块计算最优的合并调度顺序,并交至Kernel合并模块合并执行,获得最大任务吞吐率;本发明采用一般图的最大匹配计算最优合并调度顺序。通过任务分析模块计算任务的合并加速比;其次根据任务合并加速比构造有向图;通过二分图匹配算法计算最优的任务合并调度顺序;根据顺序调度任务组完成任务计算。本发明完成了上述功能的设计细节、实现算法和编码工作,提升了多任务下GPU的资源利用率。
-
公开(公告)号:CN111190688A
公开(公告)日:2020-05-22
申请号:CN201911316029.X
申请日:2019-12-19
申请人: 西安交通大学
摘要: 本发明公开一种面向云数据中心的Docker迁移方法及系统,收集集群中各个物理节点的负载信息值并量化,当监测到某个节点负载达到设定阈值或者由于损坏导致容器暂停运行的情况,产生反馈信息,在超载或空载节点上使用热点容器选择算法选择待迁移的容器,并根据待迁移容器的资源需求向量和其他节点的剩余资源量做亲和度匹配,选出目标节点集。然后在目标节点集中,根据概率选择算法选择最佳目标节点,将待迁移的容器迁移到目标节点恢复执行。本发明以最小迁移量、最短迁移时间和最低能耗为原则,进行容器迁移方法的设计,可以有效减少集群由于某个计算节点出现故障带来的损失,提高现有集群的可靠性和利用率,实现负载均衡,为集群提供了更高的可用性。
-
公开(公告)号:CN109976810A
公开(公告)日:2019-07-05
申请号:CN201910191263.8
申请日:2019-03-13
申请人: 西安交通大学
摘要: 本发明公开了一种基于OpenCL的稠密矩阵乘GPU加速方法,先在CPU上对稠密矩阵A和稠密矩阵B进行边界补齐,矩阵A和B的尺寸为OpenCL工作组的倍数;然后CPU将填充后矩阵A和B的数据传送给GPU;进行任务分配和设备内存优化,采用矩阵分块思想将矩阵待计算数据缓存至GPU局部存储器;采用向量计算合并多个矩阵元素;采用单个工作项计算多个数据方式;最后GPU按照划分的子矩阵计算每个子矩阵的运算结果,去除补齐的边界部分,将计算结果返回CPU完成加速。本发明针对稠密矩阵乘这一计算任务,在GPU上进行了多层次优化,极大提升了任务计算速度。
-
公开(公告)号:CN111090508B
公开(公告)日:2023-04-14
申请号:CN201911203540.9
申请日:2019-11-29
申请人: 西安交通大学
摘要: 本发明公开了一种基于OpenCL的异构协同并行计算中设备间动态任务调度方法,包括如下过程:首先取指定计算内核的总工作量的一部分作为初始块大小,然后在指定计算内核首次的计算执行过程中根据参与协同并行计算的各设备的理论峰值得到首次计算时各个计算设备的任务划分比例,然后在指定计算内核的执行过程中根据参与协同并行计算的各计算设备反馈的计算速度动态调整下一个块的大小以及下一次计算时各个计算设备的任务划分比例。本身发明实现了反馈式动态任务划分的效果,同时,通过该方法能够提高多设备协同并行计算整体性能。本发明完成了上述功能的设计细节、实现算法和编码工作,提升了并行计算中多设备的资源利用率。
-
公开(公告)号:CN109976810B
公开(公告)日:2021-07-13
申请号:CN201910191263.8
申请日:2019-03-13
申请人: 西安交通大学
摘要: 本发明公开了一种基于OpenCL的稠密矩阵乘GPU加速方法,先在CPU上对稠密矩阵A和稠密矩阵B进行边界补齐,矩阵A和B的尺寸为OpenCL工作组的倍数;然后CPU将填充后矩阵A和B的数据传送给GPU;进行任务分配和设备内存优化,采用矩阵分块思想将矩阵待计算数据缓存至GPU局部存储器;采用向量计算合并多个矩阵元素;采用单个工作项计算多个数据方式;最后GPU按照划分的子矩阵计算每个子矩阵的运算结果,去除补齐的边界部分,将计算结果返回CPU完成加速。本发明针对稠密矩阵乘这一计算任务,在GPU上进行了多层次优化,极大提升了任务计算速度。
-
公开(公告)号:CN109542596A
公开(公告)日:2019-03-29
申请号:CN201811231275.0
申请日:2018-10-22
申请人: 西安交通大学
摘要: 本发明公开了一种基于OpenCL内核任务的调度框架。该框架包括经LLVM编译器对OpenCL内核任务进行特征提取与特征选择,得到内核代码的编译时静态特征与运行时特征;在特征提取过程中,使用Greedy Feature Selection算法选出最重要的几个特征,避免过拟合现象;然后将选择出来的特征使用机器学习中的静态分类器预测CPU与GPU的任务划分比例;最后使用调度算法对获得的任务划分比例与平台可利用设备信息,对任务进行实际的调度,本发明完成了上述功能的设计细节、实现算法和编码工作,实现了在异构系统中通过机器学习与调度算法结合,实现对计算资源的最大化利用的一种自动化调度,提高异构系统资源利用率。
-
公开(公告)号:CN111090508A
公开(公告)日:2020-05-01
申请号:CN201911203540.9
申请日:2019-11-29
申请人: 西安交通大学
摘要: 本发明公开了一种基于OpenCL的异构协同并行计算中设备间动态任务调度方法,包括如下过程:首先取指定计算内核的总工作量的一部分作为初始块大小,然后在指定计算内核首次的计算执行过程中根据参与协同并行计算的各设备的理论峰值得到首次计算时各个计算设备的任务划分比例,然后在指定计算内核的执行过程中根据参与协同并行计算的各计算设备反馈的计算速度动态调整下一个块的大小以及下一次计算时各个计算设备的任务划分比例。本身发明实现了反馈式动态任务划分的效果,同时,通过该方法能够提高多设备协同并行计算整体性能。本发明完成了上述功能的设计细节、实现算法和编码工作,提升了并行计算中多设备的资源利用率。
-
公开(公告)号:CN109542596B
公开(公告)日:2023-09-12
申请号:CN201811231275.0
申请日:2018-10-22
申请人: 西安交通大学
摘要: 本发明公开了一种基于OpenCL内核任务的调度框架。该框架包括经LLVM编译器对OpenCL内核任务进行特征提取与特征选择,得到内核代码的编译时静态特征与运行时特征;在特征提取过程中,使用Greedy Feature Selection算法选出最重要的几个特征,避免过拟合现象;然后将选择出来的特征使用机器学习中的静态分类器预测CPU与GPU的任务划分比例;最后使用调度算法对获得的任务划分比例与平台可利用设备信息,对任务进行实际的调度,本发明完成了上述功能的设计细节、实现算法和编码工作,实现了在异构系统中通过机器学习与调度算法结合,实现对计算资源的最大化利用的一种自动化调度,提高异构系统资源利用率。
-
公开(公告)号:CN111190688B
公开(公告)日:2022-12-09
申请号:CN201911316029.X
申请日:2019-12-19
申请人: 西安交通大学
摘要: 本发明公开一种面向云数据中心的Docker迁移方法及系统,收集集群中各个物理节点的负载信息值并量化,当监测到某个节点负载达到设定阈值或者由于损坏导致容器暂停运行的情况,产生反馈信息,在超载或空载节点上使用热点容器选择算法选择待迁移的容器,并根据待迁移容器的资源需求向量和其他节点的剩余资源量做亲和度匹配,选出目标节点集。然后在目标节点集中,根据概率选择算法选择最佳目标节点,将待迁移的容器迁移到目标节点恢复执行。本发明以最小迁移量、最短迁移时间和最低能耗为原则,进行容器迁移方法的设计,可以有效减少集群由于某个计算节点出现故障带来的损失,提高现有集群的可靠性和利用率,实现负载均衡,为集群提供了更高的可用性。
-
公开(公告)号:CN109522108B
公开(公告)日:2020-10-27
申请号:CN201811279163.2
申请日:2018-10-30
申请人: 西安交通大学
摘要: 本发明公开了一种基于Kernel合并的GPU多任务调度系统及方法。包括任务分析模块、Kernel合并模块、任务调度模块和任务存储队列。用户提交GPU任务至任务存储队列,任务分析模块计算任务间的合并加速比,任务调度模块计算最优的合并调度顺序,并交至Kernel合并模块合并执行,获得最大任务吞吐率;本发明采用一般图的最大匹配计算最优合并调度顺序。通过任务分析模块计算任务的合并加速比;其次根据任务合并加速比构造无向图;通过二分图匹配算法计算最优的任务合并调度顺序;根据顺序调度任务组完成任务计算。本发明完成了上述功能的设计细节、实现算法和编码工作,提升了多任务下GPU的资源利用率。
-
-
-
-
-
-
-
-
-