基于片上分块的大规模三维矩阵转置的众核并行优化方法

    公开(公告)号:CN112559435A

    公开(公告)日:2021-03-26

    申请号:CN201910918612.1

    申请日:2019-09-26

    IPC分类号: G06F15/173

    摘要: 本发明公开一种基于片上分块的大规模三维矩阵转置的众核并行优化方法,包括以下步骤:S1、根据三维数组的最高维对每个从核的任务进行划分,利用异构众核访存接口实现数据的快速传输;S2、利用片上加速接口对矩阵进行分块,通过片上加速接口对每个分块进行加速运算。本发明将三维数组进行片上分块,利用异构众核架构对分块进行并行加速,实现高效的数组转置,适用于绝大多数数值计算中需要对大规模三维矩阵转置的众多工程应用软件,极大的提高程序整体性能。

    面向异构众核架构的离散访存读写方法

    公开(公告)号:CN112540936A

    公开(公告)日:2021-03-23

    申请号:CN201910898087.1

    申请日:2019-09-23

    IPC分类号: G06F12/0877 G06F13/16

    摘要: 本发明公开一种面向异构众核架构的离散访存读写方法,包括以下步骤:S1、将众核组共同组成一个存储块,将参与计算的物理量均匀分布在各计算核心的私有存储空间中,并通过建立索引关系可找到不同下标计算时数组的具体位置,再利用核间通信机制实现核间数据的访问;S2、利用步骤S1的映射同时结合非阻塞通信来批量获取数据,并将重排好的数据存入本地私有高速缓冲区中;S3、将步骤S1以预处理方式独立于计算之外,并根据课题需求可使用主从异步并行方式,继续隐藏建立映射过程带来的额外开销。本发明面向异构众核架构的离散访存读写方法,其利用分布式存储技术及其映射机制与高效非阻塞批处理数据重排方法,有效避免频繁的访主存,提高众核并行效率。

    基于指令序列与消息序列指引的深度依赖问题并行方法

    公开(公告)号:CN112527394A

    公开(公告)日:2021-03-19

    申请号:CN201910879931.6

    申请日:2019-09-18

    IPC分类号: G06F9/38 G06F9/30

    摘要: 本发明公开一种基于指令序列与消息序列指引的深度依赖问题并行方法,包括以下步骤:S1、将解向量按块进行平均划分,通过这种划分将解向量中各元素之间的依赖性转换成向量块之间的依赖性;S2、将一个向量块完成计算称为一次更新操作,此一次更新操作需要以下三个步骤:S21、部分更新:接收前继块发送的数据;S22、自我更新:对块内元素进行计算更新;S23、完成更新:将本向量块求解完毕的元素发送给所依赖的后继块;S3、众核内每个计算核心按顺序计算相应的向量块,重复S2的更新操作步骤,实现了整个流水线作业计算;S4、为每个计算核心设计一串指令流,即指令序列。本发明提高众核内部通信的相互协作性,减少访存时间开销,实现有效加速。

    解决非结构网格离散访存问题众核并行优化算法

    公开(公告)号:CN112445604A

    公开(公告)日:2021-03-05

    申请号:CN201910799249.6

    申请日:2019-08-28

    IPC分类号: G06F9/50

    摘要: 本发明公开一种解决非结构网格离散访存问题众核并行优化算法,包括以下步骤:S1、将网格单元周围的网格面通量数据分为若干数据块,并将不同数据块定义为不同属性;S2、将分块后的数据块并行拷入各个从核中;S3、各从核并行遍历拷入的数据块中的数据,按照该数据所对应的l(u)所在的位置,对一个数据块中的若干数据进行局部重排,并记录重排后各个数据位置索引;S4、各从核分别从主存中拷入一个通量数据块,并根据S3记录的位置索引,从重排序后的暂存空间中,拷入通量数据块所需要的Lower数据、Upper数据进行计算。本发明对非结构网格离散访存问题进行基于众核的重排序优化,极大减少了离散访存时间,提高该类问题的求解效率,从而提高整个应用系统的运行效率。

    一种数值预报产品实时处理方法

    公开(公告)号:CN105678060B

    公开(公告)日:2018-04-10

    申请号:CN201511027453.4

    申请日:2015-12-31

    IPC分类号: G06F19/00 G06Q10/04

    摘要: 一种数值预报产品实时处理方法,包括:使用数值预报系统计算预报数据,数值预报系统将每次计算的预报数据保存在文件系统中;采用预报产品生产服务进程,以服务运行方式,读取数值预报系统计算的预报数据,实时判断数值预报系统计算的预报数据是否加入了新数据,在加入了新数据的情况下,从文件系统中读入新数据进行更新;实时接收预报产品发布服务进程发送的针对预报区域内使用经纬度坐标确定的任意点的预报数据请求;响应于接收的针对该任意点的预报数据请求,对数值预报系统计算的预报数据进行实时处理,通过预定算法生成发布服务进程请求的预报区域内使用经纬度坐标确定的任意点的预报产品,将该任意点的预报产品返回给预报产品发布服务进程。

    基于异构众核处理器的多级访存方法、离散访存方法

    公开(公告)号:CN102929724B

    公开(公告)日:2016-04-13

    申请号:CN201210441328.8

    申请日:2012-11-06

    IPC分类号: G06F9/50 G06F13/16

    摘要: 本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据计算的同时,写回上一次计算结果数据;从核写回最后一次计算结果数据。所述离散访存方法包括:在从核上调整数组的存储顺序,将离散存储的数组调整为连续存储的数组;从核以多级访存方法,对所述数组进行通信读入数据、计算和通信写回数据。本发明实现了有效计算开销和多级存储资源访问开销之间最大限度的隐藏,提高了多级访存效率,充分发挥了从核的性能效率,从而提高科学计算课题的计算效率。