一种基于新一代申威众核处理器从核局存受限优化方法

    公开(公告)号:CN118245118A

    公开(公告)日:2024-06-25

    申请号:CN202410679259.7

    申请日:2024-05-29

    IPC分类号: G06F9/38

    摘要: 本发明涉及一种基于新一代申威众核处理器从核局存受限优化方法,属于电子信息的技术领域,包括:针对依赖数据占用存储小于共享LDM最大存储空间的情况,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在数组中,从核通过DMA或者共享LDM空间DMA方式从主核获取依赖数据,完成计算;针对依赖数据占用存储不小于共享LDM最大存储空间的情况,在主核中构建一个哈希表,主核提前计算循环中的依赖部分,并将计算得出的依赖数据存储在哈希表中;从核通过DMA或者共享LDM空间DMA方式获取哈希表,从而获取所需的依赖数据,完成计算。本发明将预先计算好的依赖部分分配给从核执行,从而有效提高程序的效率。

    一种基于新一代申威众核处理器的进程间通信优化方法

    公开(公告)号:CN118012818A

    公开(公告)日:2024-05-10

    申请号:CN202410428041.4

    申请日:2024-04-10

    IPC分类号: G06F15/173 G06F9/54

    摘要: 本发明涉及一种基于新一代申威众核处理器的进程间通信优化方法;属于电子信息的技术领域,将芯片内的核组划分不同的进程通信域;包括芯片之间的通信优化和芯片内部的通信优化;芯片之间的通信优化,包括:划分通信域;划分进程,将不同的进程分配到不同的通信域中;不同进程根据数据使用规律和机器硬件架构划分到不同的通信域;在不同的通信域中同时进行不同的进程间通信操作;芯片内部的通信优化,包括:对于不同类型的进程间通信操作,由一个特定的核组编号的进程在交叉段上申请一片空间,在同一芯片上的不同核组分别向交叉段中特定位置同时添加数据,在所有进程间执行一次同步。本发明为不同类型的进程通信操作提供了不同的方法。

    基于新一代申威众核处理器多分支自动分析并行优化方法

    公开(公告)号:CN118245117B

    公开(公告)日:2024-08-09

    申请号:CN202410676339.7

    申请日:2024-05-29

    IPC分类号: G06F9/38

    摘要: 本发明涉及基于新一代申威众核处理器多分支自动分析并行优化方法,属于电子信息的技术领域;包括:对源码进行预处理,仅保留源码中的主要特征信息;对保留的源码中的主要特征信息进行分析,识别并标记应用程序中的热点;通过标签法对热点进行分类,并将热点以任务的形式散播到各从核块中;根据计算量的大小,选择不同的从核块,并自动通过不同方法处理具有不同特征的热点程序段。本发明考虑面向应用程序进行并行优化时,需要进行大量工作对程序进行标记分析,耗费很多资源,所以需要一种自动化并行工具,对程序进行分析和并行优化。因此本发明减少了并行编程的难度,提高了并行编程的效率。本发明具有明显的加速效果,且能很好的满足用户的需求。

    基于申威众核处理器的含依赖及交叉循环从核优化方法

    公开(公告)号:CN118409801A

    公开(公告)日:2024-07-30

    申请号:CN202410888133.0

    申请日:2024-07-04

    IPC分类号: G06F9/38 G06F9/30 G06F15/173

    摘要: 本发明涉及基于申威众核处理器的含依赖及交叉循环从核优化方法,属于电子信息的技术领域。包括:对在每次计算周期内存在较大依赖的数据进行预处理,降低依赖数据的依赖强度,即:将最高维度的依赖数据降低到不影响计算的最低维度;将多个步骤的计算过程合并到一次从核组启动到关闭的过程中,并且将从核组再次细化为若干个从核小组,从核小组间采用单指令流多数据流的并行策略,从核小组内采用多指令流多数据流的并行策略;显式管理利用局部数据存储LDM,一次性从主存传入所需要的计算数据。本发明有效降低了一次传入从核LDM中的数据量,节约了LDM的使用空间,降低了传输的带宽压力,增加了LDM使用和数据传输效率。

    一种基于新一代申威众核处理器的进程间通信优化方法

    公开(公告)号:CN118012818B

    公开(公告)日:2024-07-19

    申请号:CN202410428041.4

    申请日:2024-04-10

    IPC分类号: G06F15/173 G06F9/54

    摘要: 本发明涉及一种基于新一代申威众核处理器的进程间通信优化方法;属于电子信息的技术领域,将芯片内的核组划分不同的进程通信域;包括芯片之间的通信优化和芯片内部的通信优化;芯片之间的通信优化,包括:划分通信域;划分进程,将不同的进程分配到不同的通信域中;不同进程根据数据使用规律和机器硬件架构划分到不同的通信域;在不同的通信域中同时进行不同的进程间通信操作;芯片内部的通信优化,包括:对于不同类型的进程间通信操作,由一个特定的核组编号的进程在交叉段上申请一片空间,在同一芯片上的不同核组分别向交叉段中特定位置同时添加数据,在所有进程间执行一次同步。本发明为不同类型的进程通信操作提供了不同的方法。

    基于申威众核处理器的主从核监测交互的计算量调度方法

    公开(公告)号:CN117632520B

    公开(公告)日:2024-05-17

    申请号:CN202410100805.7

    申请日:2024-01-25

    IPC分类号: G06F9/50 G06F15/173 G06F15/78

    摘要: 本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。包括:在计算量传输过程中,通过从核状态监测器SW‑CSM实现主核对从核状态的判断与监测;通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。

    一种申威众核处理器从核簇加速并行方法、设备及介质

    公开(公告)号:CN117472448A

    公开(公告)日:2024-01-30

    申请号:CN202311829650.2

    申请日:2023-12-28

    IPC分类号: G06F9/38 G06F15/163

    摘要: 本发明涉及一种申威众核处理器从核簇加速并行方法、设备及介质,属于电子信息技术领域;包括:应用程序优化阶段:对应用程序进行优化;输入导入阶段:将各从核所需的输入条件从主存储器传入LDM连续共享空间;计算与RMA传输阶段:计算从核即刻开始执行计算任务;从核将计算结果传输到主存储器时,由汇总从核将计算结果读取到本地LDM;汇总与整理阶段:汇总从核读取完计算从核此时的计算结果后进行整理;DMA传输阶段:将计算结果传输至主存储器中;重复执行上述阶段直到当前迭代次数达到预先设定的迭代总次数。本发明提供了适合处理以上情况的多种优化方法,拥有明显的加速效果,减少了使用难度,提高了用户体验。

    基于申威众核处理器的从核阵列自主抢占式负载均衡方法

    公开(公告)号:CN118860672A

    公开(公告)日:2024-10-29

    申请号:CN202411345437.9

    申请日:2024-09-26

    IPC分类号: G06F9/50 G06F9/54

    摘要: 本发明涉及基于申威众核处理器的从核阵列自主抢占式负载均衡方法,属于电子信息的技术领域,包括:1)针对大规模任务,采用分治法进行分解;2)对于得到的小规模任务,进行动静态混合的任务划分;在静态任务区中,采用均匀分配方式,在动态任务区中,采用动态分配方式;3)将动态任务区的每个任务执行信息映射到一个标识缓冲区中;同时采用双缓冲的策略,通过配置两个标识缓冲区,实现在执行本轮任务的同时将下一轮使用的缓冲区重置;在从核成功获取到要执行的任务执行信息后,使用DMA的方式,将在动态任务区中读取到的任务在本从核的LDM私有空间中进行计算。本发明具有比较明显的加速效果。