-
公开(公告)号:CN117436370B
公开(公告)日:2024-03-19
申请号:CN202311658183.1
申请日:2023-12-06
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F30/28 , G06F17/13 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
摘要: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。
-
公开(公告)号:CN117436370A
公开(公告)日:2024-01-23
申请号:CN202311658183.1
申请日:2023-12-06
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06F30/28 , G06F17/13 , G06F17/16 , G06F111/10 , G06F113/08 , G06F119/14
摘要: 本公开提供了面向流体力学网格生成的超定矩阵方程并行方法及系统,涉及计算流体力学数值模拟技术领域,包括建立以网格顶点坐标值为未知数的超定稀疏矩阵方程;并行获取新的系数矩阵和右端项,各子矩阵矩阵乘、子矩阵子向量乘计算的任务划分策略是按照转置矩阵的行数分给各处理器;采用并行共轭梯度法求解,任务划分策略是以非零元个数作为划分的依据,各个处理器迭代并行计算当前近似解的最优方向、最优步长以及新的近似解,直至残差满足设置的迭代终止条件双检测要求,将最优解作为超定稀疏矩阵方程的网格顶点坐标值,构造出所期望的三维空间结构化网格。本公开提高了高精度应用需求的结构化网格生成能力。
-
公开(公告)号:CN118656126A
公开(公告)日:2024-09-17
申请号:CN202410820407.2
申请日:2024-06-24
摘要: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。
-
-