-
公开(公告)号:CN112783503B
公开(公告)日:2023-12-22
申请号:CN202110062369.5
申请日:2021-01-18
申请人: 中山大学
IPC分类号: G06F8/41
摘要: 本发明为克服Arm平台上原生NumPy库存在计算性能低下的缺陷,提出一种基于Arm架构的NumPy运算加速优化方法,包括以下步骤:配置Arm架构环境,获取NumPy源代码;对NumPy源代码中待优化函数进行类型判断:若待优化函数为数值计算类函数,则对待优化函数进行循环体优化,再对待优化函数进行多线程处理;否则直接对待优化函数进行多线程处理;然后将完成函数优化的NumPy源代码进行编译优化。本发明对Arm架构环境中的NumPy源代码进行优化,根据NumPy源代码中的函数类型执行循环体优化、多线程处理等操作,能够有效提高了依赖于NumPy的各类Python程序运行效率。
-
公开(公告)号:CN112860530B
公开(公告)日:2022-09-27
申请号:CN202110122117.7
申请日:2021-01-27
申请人: 中山大学
摘要: 本发明公开了一种利用非统一内存访问架构特点提升并行化NumPy计算性能的方法,所述方法包括针对NUMA架构及NumPy并行计算的特点分析;针对NumPy并行计算及NUMA架构优化的CPU分配程序与基于CPU分配程序及进程绑定的优化版NumPy并行计算系统。本发明的有益效果在于,可以由CPU分配器根据NUMA架构计算机以及NumPy并行计算的特点,生成一个CPU配置文件,利用进程绑定,把进程绑定到适合的CPU核心上运行。这样可以更有效地利用计算机的硬件资源的同时,减少进程迁移带来的性能问题,提升并行计算的性能。
-
公开(公告)号:CN112860530A
公开(公告)日:2021-05-28
申请号:CN202110122117.7
申请日:2021-01-27
申请人: 中山大学
摘要: 本发明公开了一种利用非统一內存访问架构特点提升并行化NumPy计算性能的方法,所述方法包括针对NUMA架构及NumPy并行计算的特点分析;针对NumPy并行计算及NUMA架构优化的CPU分配程序与基于CPU分配程序及进程绑定的优化版NumPy并行计算系统。本发明的有益效果在于,可以由CPU分配器根据NUMA架构计算机以及NumPy并行计算的特点,生成一个CPU配置文件,利用进程绑定,把进程绑定到适合的CPU核心上运行。这样可以更有效地利用计算机的硬件资源的同时,减少进程迁移带来的性能问题,提升并行计算的性能。
-
公开(公告)号:CN112783503A
公开(公告)日:2021-05-11
申请号:CN202110062369.5
申请日:2021-01-18
申请人: 中山大学
IPC分类号: G06F8/41
摘要: 本发明为克服Arm平台上原生NumPy库存在计算性能低下的缺陷,提出一种基于Arm架构的NumPy运算加速优化方法,包括以下步骤:配置Arm架构环境,获取NumPy源代码;对NumPy源代码中待优化函数进行类型判断:若待优化函数为数值计算类函数,则对待优化函数进行循环体优化,再对待优化函数进行多线程处理;否则直接对待优化函数进行多线程处理;然后将完成函数优化的NumPy源代码进行编译优化。本发明对Arm架构环境中的NumPy源代码进行优化,根据NumPy源代码中的函数类型执行循环体优化、多线程处理等操作,能够有效提高了依赖于NumPy的各类Python程序运行效率。
-
公开(公告)号:CN113515365B
公开(公告)日:2023-10-03
申请号:CN202110062370.8
申请日:2021-01-18
申请人: 中山大学
IPC分类号: G06F9/50 , G06F9/38 , G06F9/54 , G06F15/173
摘要: 本发明为克服现有技术中NumPy在集群和多核计算环境下的性能不理想、兼容性差的缺陷,提出一种利用MPI的NumPy优化方法及系统,其根据集群和/或主机中CPU的使用情况,对集群和/或主机中的CPU资源进行分配;采用MPI进行数据交换通信,根据当前两个进程所绑定的CPU核心的物理位置,或根据主机间连接的网络方式,选择当前两个进程之间的通信方式;确定当前计算节点需要并行实现的NumPy方法,选择当前计算节点中NumPy方法的具体实现方式,包括使用线性代数计算库IntelMKL连接NumPy进行并行计算、使用OpenBLAS连接NumPy进行并行计算,或使用Cython进行并行计算。
-
公开(公告)号:CN113515365A
公开(公告)日:2021-10-19
申请号:CN202110062370.8
申请日:2021-01-18
申请人: 中山大学
IPC分类号: G06F9/50 , G06F9/38 , G06F9/54 , G06F15/173
摘要: 本发明为克服现有技术中NumPy在集群和多核计算环境下的性能不理想、兼容性差的缺陷,提出一种利用MPI的NumPy优化方法及系统,其根据集群和/或主机中CPU的使用情况,对集群和/或主机中的CPU资源进行分配;采用MPI进行数据交换通信,根据当前两个进程所绑定的CPU核心的物理位置,或根据主机间连接的网络方式,选择当前两个进程之间的通信方式;确定当前计算节点需要并行实现的NumPy方法,选择当前计算节点中NumPy方法的具体实现方式,包括使用线性代数计算库IntelMKL连接NumPy进行并行计算、使用OpenBLAS连接NumPy进行并行计算,或使用Cython进行并行计算。
-
-
-
-
-