一种稀疏矩阵的存储处理方法及装置

    公开(公告)号:CN112953549A

    公开(公告)日:2021-06-11

    申请号:CN202110181916.1

    申请日:2021-02-08

    IPC分类号: H03M7/30

    摘要: 本发明涉及一种稀疏矩阵的存储处理方法及装置,所述存储处理方法包括:将稀疏矩阵划分为N个子矩阵,并确定所述N个子矩阵各自对应的行编号和列编号;以及,从所述子矩阵中依次获取非零元素组成非零元素数组;获取所述N个子矩阵各自对应的比特序列;其中,对于所述N个子矩阵中任意的第i个子矩阵:第i个矩阵中的第j个元素为零元素时,其对应的第i个比特序列中的第j个比特位的值为0;第i个矩阵中的第j个元素为非零元素时,其对应的第i个比特序列中的第j个比特位的值为1;顺序存储所述N个子矩阵各自对应的所述行编号、所述列编号、所述比特序列以及所述非零元素数组。采用本申请实施例提供的方法,可以节省大量的存储空间。

    面向反应堆堆芯组件数值模拟的有限元撕裂对接法及系统

    公开(公告)号:CN112733401A

    公开(公告)日:2021-04-30

    申请号:CN202011607981.8

    申请日:2020-12-30

    IPC分类号: G06F30/23 G06F17/16

    摘要: 本发明公开一种面向反应堆堆芯组件数值模拟的有限元撕裂对接法及系统。n个计算节点中每个计算节点均设有上述有限元撕裂对接系统,每个计算节点拥有g块类GPU加速器。本发明采用了负载均衡策略,使得各进程的稠密矩阵内存大小趋于平均值,充分利用集群资源,加快求解速度。采用HIP编程,使得有限元撕裂对接法运行在NvidiaCUDA平台和AMDROMc平台。在迭代求解过程的稠密矩阵向量乘阶段中,采用动态分配矩阵策略,使得不同处理器分配到合适的计算量,以充分利用计算资源,加快求解速度。在向量内积阶段,采用了向量内积加速策略和通信计算重叠策略,通过引入通信线程,减少通信等待时间,加快向量内积速度。

    一种适用于数值反应堆的大规模并行网格生成方法和系统

    公开(公告)号:CN112464540A

    公开(公告)日:2021-03-09

    申请号:CN202011495076.8

    申请日:2020-12-17

    IPC分类号: G06F30/23 G06F111/10

    摘要: 本发明提供一种适用于数值反应堆的大规模并行网格生成方法和系统,包括基于无锁原子操作的网格单元构造方法,用于提高多线程网格构造效率,避免线程阻塞等待;基于OpenMP框架的并行网格转换方法,用于加快网格转换过程,缩短网格转换时间;网格生成器与求解器集成方法,用于避免网格文件写入、读取的I/O时长。本发明满足了大规模并行网格生成的巨大需求,用户能够在更短的时间内获得指定规模的网格,且能够保证良好的网格质量。本发明提出的将网格生成器与求解器集成的方案,能形成整体的数值模拟框架,降低用户使用成本,并且进一步缩短网格生成时间。

    一种应用性能分析系统及方法
    75.
    发明公开

    公开(公告)号:CN111611158A

    公开(公告)日:2020-09-01

    申请号:CN202010383480.X

    申请日:2020-05-08

    IPC分类号: G06F11/36

    摘要: 本发明涉及一种应用性能分析系统及方法,该系统包括显存泄漏分析模块和核函数执行时间模块;其中,显存泄漏分析模块,用于通过分析静态程序的抽象语法树,对指针地址映射集合进行增、删、改操作,来记录对显存的操作;通过分析指针地址映射集合里是否有空指针或者还未释放的显存地址;核函数执行时间模块,用于通过相应接口捕获需要统计的核函数执行名称,在应用程序的目标核函数执行前进行捕获,插入CPU/GPU时间测量代码片段,在程序运行结束时汇总统计的时间,并进行展示。本发明在程序运行前进行分析,尽可能早的发现程序是否有显存泄漏问题。