一种基于可重构线程发散的线程束大小测算方法
摘要:
本发明公开了一种基于可重构线程发散的线程束大小测算方法,构建第一CUDA核函数重构线性发散使处于不同线程束的线程产生内存访问冲突以大幅增加线程的执行时间,通过逐渐增大线程块大小使其中的线程被分配到不同线程束中执行导致执行时间增大,实现对线程束大小的粗粒度测算;构造第二CUDA核函数重构线性发散使线程块内最后一个线程执行复杂计算增加执行时间,通过细粒度增大线程块大小使最后一个线程被分配到不同线程束中执行导致第一个线程的执行时间明显减小,实现对线程束大小的细粒度精确测算,在不借助查询硬件手册的情况下以软件方式精确度量了GPU的线程束大小,为相关计算程序优化提供了准确的参数支撑。
0/0