-
公开(公告)号:CN101782930B
公开(公告)日:2012-08-22
申请号:CN200910003257.1
申请日:2009-01-21
Applicant: 国际商业机器公司
IPC: G06F17/50
CPC classification number: G16C10/00
Abstract: 本发明提供一种在多处理器系统上进行分子动力学模拟的方法和装置。该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括:将需要进行分子动力学模拟的物质空间划分为多个小盒子;以每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中的方式,将上述多个小盒子的分子数据存储在该多处理器系统的主存储器中;以在一次DMA操作中获取至少一个小盒子的分子数据的方式,使上述多个加速器并行地从主存储器中重复获取上述多个小盒子的分子数据,并进行分子动力学模拟计算。本发明通过使每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中,能够使各加速器在进行模拟时减少与主存储器的数据交换,从而提高模拟性能。
-
公开(公告)号:CN101676864A
公开(公告)日:2010-03-24
申请号:CN200810213578.X
申请日:2008-09-16
Applicant: 国际商业机器公司
Abstract: 本发明提供了一种单处理器系统中获取向量的欧几里得范数的方法和装置以及多处理器系统中获取向量的欧几里得范数的方法和装置。其中该单处理器系统中获取向量的欧几里得范数的方法包括:将要获取欧几里得范数的向量划分为具有预定数量的元素的多个段;对于上述多个段的每一个,为该段内的元素进行基于同一缩放因子的平方累加计算,以得到该多个段的元素的平方和;以及根据上述多个段的元素的平方和,得到上述向量的欧几里得范数。本发明通过按段消除向量中的元素之间的依赖关系,能够实现数据处理的并行性,从而提升计算性能。
-
公开(公告)号:CN104252391B
公开(公告)日:2017-09-12
申请号:CN201310267938.5
申请日:2013-06-28
Applicant: 国际商业机器公司
CPC classification number: G06F9/5083 , G06F9/5027 , G06F9/52 , G06F15/00 , G06Q10/06 , H04L41/0886 , H04L41/0893 , H04L41/5096
Abstract: 本发明的各实施方式提供了用于在分布式计算系统中管理多个作业的方法和装置。在一个实施方式中,提供了一种用于在分布式计算系统中管理多个作业的方法,包括:响应于接收到多个作业,将多个作业中的每个作业所包括的多个任务划分为配置任务和计算任务,其中多个作业中的每个作业是可执行程序;将与多个作业相关联的配置任务组合为一超级配置任务;基于超级配置任务和计算任务来将多个作业整合为一超级作业;以及利用分布式计算环境中的多个计算节点,执行包括在超级作业中的超级配置任务和计算任务。在另一实施方式中,提供了一种用于在分布式计算系统中管理多个作业的装置。采用本发明,可以提高分布式计算系统的运行效率。
-
公开(公告)号:CN101572689A
公开(公告)日:2009-11-04
申请号:CN200810083952.9
申请日:2008-04-29
Applicant: 国际商业机器公司
Abstract: 本发明提供了一种在多处理器系统中的网络接口卡与加速器之间传输数据的方法和装置。其中该多处理器系统包括至少一个核心处理器、多个加速器以及可以被上述核心处理器、上述多个加速器和上述网络接口卡读取的主存储器。该方法包括:将在上述网络接口卡与上述多个加速器之间传输的数据以至少一个原始数据包的形式存储到上述主存储器中;设置上述原始数据包在上述主存储器中的存储位置标识;以及使上述网络接口卡或上述多个加速器根据上述存储位置标识从上述主存储器获取上述原始数据包。本发明能够优化诸如CBE的多处理器系统中的NIC驱动器与加速器之间的数据传输过程,提高系统的数据传输效率。
-
公开(公告)号:CN104252391A
公开(公告)日:2014-12-31
申请号:CN201310267938.5
申请日:2013-06-28
Applicant: 国际商业机器公司
CPC classification number: G06F9/5083 , G06F9/5027 , G06F9/52 , G06F15/00 , G06Q10/06 , H04L41/0886 , H04L41/0893 , H04L41/5096
Abstract: 本发明的各实施方式提供了用于在分布式计算系统中管理多个作业的方法和装置。在一个实施方式中,提供了一种用于在分布式计算系统中管理多个作业的方法,包括:响应于接收到多个作业,将多个作业中的每个作业所包括的多个任务划分为配置任务和计算任务,其中多个作业中的每个作业是可执行程序;将与多个作业相关联的配置任务组合为一超级配置任务;基于超级配置任务和计算任务来将多个作业整合为一超级作业;以及利用分布式计算环境中的多个计算节点,执行包括在超级作业中的超级配置任务和计算任务。在另一实施方式中,提供了一种用于在分布式计算系统中管理多个作业的装置。采用本发明,可以提高分布式计算系统的运行效率。
-
公开(公告)号:CN102486739B
公开(公告)日:2015-03-25
申请号:CN200910225838.X
申请日:2009-11-30
Applicant: 国际商业机器公司
CPC classification number: G06F9/5066
Abstract: 本发明公开了一种在高性能计算集群中分发数据的方法和系统,该高性能计算集群包括一个中控节点和M个计算节点,M为大于等于2的整数,该中控节点向该M个计算节点分发指定数据,该方法包括:将M个计算节点分为m层,m为大于等于2的整数;将所述指定数据分成k份,k为大于等于2的整数;该中控节点将所述k份数据分发给作为其子节点的第一层计算节点,第一层的每个计算节点获得其中的至少一份数据;各计算节点把其父节点分发的所述至少一份数据分发给其子计算节点;以及各计算节点向其它计算节点请求其余的指定数据,从而获得全部所述指定数据。该方法和系统能够在高性能计算集群中快速将数据分发到各个计算节点。
-
公开(公告)号:CN102486739A
公开(公告)日:2012-06-06
申请号:CN200910225838.X
申请日:2009-11-30
Applicant: 国际商业机器公司
CPC classification number: G06F9/5066
Abstract: 本发明公开了一种在高性能计算集群中分发数据的方法和系统,该高性能计算集群包括一个中控节点和M个计算节点,M为大于等于2的整数,该中控节点向该M个计算节点分发指定数据,该方法包括:将M个计算节点分为m层,m为大于等于2的整数;将所述指定数据分成k份,k为大于等于2的整数;该中控节点将所述k份数据分发给作为其子节点的第一层计算节点,第一层的每个计算节点获得其中的至少一份数据;各计算节点把其父节点分发的所述至少一份数据分发给其子计算节点;以及各计算节点向其它计算节点请求其余的指定数据,从而获得全部所述指定数据。该方法和系统能够在高性能计算集群中快速将数据分发到各个计算节点。
-
公开(公告)号:CN101782930A
公开(公告)日:2010-07-21
申请号:CN200910003257.1
申请日:2009-01-21
Applicant: 国际商业机器公司
IPC: G06F17/50
CPC classification number: G16C10/00
Abstract: 本发明提供一种在多处理器系统上进行分子动力学模拟的方法和装置。该多处理器系统包括至少一个核心处理器以及多个加速器。该方法包括:将需要进行分子动力学模拟的物质空间划分为多个小盒子;以每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中的方式,将上述多个小盒子的分子数据存储在该多处理器系统的主存储器中;以在一次DMA操作中获取至少一个小盒子的分子数据的方式,使上述多个加速器并行地从主存储器中重复获取上述多个小盒子的分子数据,并进行分子动力学模拟计算。本发明通过使每一个小盒子的分子数据连续存储在与该小盒子对应的存储区域中,能够使各加速器在进行模拟时减少与主存储器的数据交换,从而提高模拟性能。
-
-
-
-
-
-
-