基于kernel函数的时间开销模型构建方法及系统

    公开(公告)号:CN106502771A

    公开(公告)日:2017-03-15

    申请号:CN201610816194.1

    申请日:2016-09-09

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明公开一种基于kernel函数的时间开销模型构建方法及系统,首先将并行程序kernel函数的开销时间分为线程块的分配时间和kernel函数的执行时间两个部分,然后分别对这两部分时间进行分析,构建相应的时间方程;其中执行时间部分充分考虑到了计算与访存的重叠以及可能出现的各种情况,并提出两个并行度参数来对kernel函数的执行时间进行表示;最后将这两部分时间进行叠加,得到最终的kernel函数时间开销模型。用户通过该模型能够得到应用程序在GPU上的运行时间,便于广大用户及时分析待移植的程序,合理安排工作,同时也有利于GPU的有效利用,避免经济与时间上的损失。

    基于kernel函数的时间开销模型构建方法及系统

    公开(公告)号:CN106502771B

    公开(公告)日:2019-08-02

    申请号:CN201610816194.1

    申请日:2016-09-09

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明公开一种基于kernel函数的时间开销模型构建方法及系统,首先将并行程序kernel函数的开销时间分为线程块的分配时间和kernel函数的执行时间两个部分,然后分别对这两部分时间进行分析,构建相应的时间方程;其中执行时间部分充分考虑到了计算与访存的重叠以及可能出现的各种情况,并提出两个并行度参数来对kernel函数的执行时间进行表示;最后将这两部分时间进行叠加,得到最终的kernel函数时间开销模型。用户通过该模型能够得到应用程序在GPU上的运行时间,便于广大用户及时分析待移植的程序,合理安排工作,同时也有利于GPU的有效利用,避免经济与时间上的损失。

    GPU编程模型中核函数最优尺寸求解方法及装置

    公开(公告)号:CN106651739B

    公开(公告)日:2019-08-16

    申请号:CN201610827221.5

    申请日:2016-09-14

    IPC分类号: G06T1/20

    摘要: 本发明提供一种GPU编程模型中核函数最优尺寸求解方法及装置,通过构建时间开销模型能够满足并行应用程序的基本要求,保证对时间开销预测的有效性,且预测结果更为真实。通过分析时间开销模型中的参数,增设约束条件,构造尺寸优化模型,使对kernel函数尺寸的分析更全面合理,提高模型的精度和运行效率。采用分类讨论的思想,对并行程序在GPU上执行时可能出现的三种情况进行详细分析,对每种情况下kernel函数的尺寸进行求解,得到简单易操作的公式来指导用户进行尺寸的快速选择。可在不运行并行应用程序的情况下,通过静态分析得到kernel函数的最优尺寸,大大的提高工作与生产效率。

    GPU编程模型中核函数最优尺寸求解方法及装置

    公开(公告)号:CN106651739A

    公开(公告)日:2017-05-10

    申请号:CN201610827221.5

    申请日:2016-09-14

    IPC分类号: G06T1/20

    CPC分类号: G06T1/20 G06T2200/28

    摘要: 本发明提供一种GPU编程模型中核函数最优尺寸求解方法及装置,通过构建时间开销模型能够满足并行应用程序的基本要求,保证对时间开销预测的有效性,且预测结果更为真实。通过分析时间开销模型中的参数,增设约束条件,构造尺寸优化模型,使对kernel函数尺寸的分析更全面合理,提高模型的精度和运行效率。采用分类讨论的思想,对并行程序在GPU上执行时可能出现的三种情况进行详细分析,对每种情况下kernel函数的尺寸进行求解,得到简单易操作的公式来指导用户进行尺寸的快速选择。可在不运行并行应用程序的情况下,通过静态分析得到kernel函数的最优尺寸,大大的提高工作与生产效率。