面向流体力学网格生成的超定矩阵方程并行方法及系统

    公开(公告)号:CN117436370B

    公开(公告)日:2024-03-19

    申请号:CN202311658183.1

    申请日:2023-12-06

    摘要: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。

    面向流体力学网格生成的超定矩阵方程并行方法及系统

    公开(公告)号:CN117436370A

    公开(公告)日:2024-01-23

    申请号:CN202311658183.1

    申请日:2023-12-06

    摘要: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。

    一种基于神威超级计算机的AztecOO移植优化方法及系统

    公开(公告)号:CN118656126A

    公开(公告)日:2024-09-17

    申请号:CN202410820407.2

    申请日:2024-06-24

    IPC分类号: G06F8/76 G06F8/30 G06F17/16

    摘要: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。