一种GPGPU寄存器缓存的实现方法

    公开(公告)号:CN104182281B

    公开(公告)日:2017-10-31

    申请号:CN201410418801.X

    申请日:2014-08-25

    IPC分类号: G06F9/50

    CPC分类号: Y02D10/22 Y02D10/36

    摘要: 本发明公开了一种GPGPU寄存器缓存的实现方法。各个流处理器移除原有寄存器文件,增加用于存储正在执行线程所需寄存器的寄存器缓存,线程执行前从内存中加载寄存器数据到寄存器缓存。在线程执行所需的寄存器能保存在流处理器的寄存器缓存中的前提下,从所有可执行的线程中选择线程数量最多的线程组合执行,从内存中加载选择的线程组合中每个线程所使用的寄存器数据到寄存器缓存,然后以任意方式对线程组合中的线程进行选择执行,当选择的线程组合中所有线程都无法执行时,重新选择另一组线程。本发明减少流处理器寄存器文件所需存储空间,降低能耗和面积,解除流处理器寄存器数量不足的限制,提高系统效率。

    一种GPU上的访存方法
    2.
    发明授权

    公开(公告)号:CN104199782B

    公开(公告)日:2017-04-26

    申请号:CN201410419711.2

    申请日:2014-08-25

    IPC分类号: G06F12/02

    摘要: 本发明公开了一种GPU上的访存方法。本发明对流处理器中发出的请求进行访存融合;流处理器将融合后的访存请求发送到相应内存中;内存中将融合后的访存请求进行拆分,并读出数据;内存中将读出数据形成数据块返回到流处理器;流处理器对发回的数据块进行处理、存储。本发明通过对访存地址具有相同间隔的访存请求进行融合,提高了访存效率,隐藏了内存延迟,提高了GPU的综合性能。可将本方法与现有方法结合使用,从而使得程序有一定程度的性能提升。

    一种GPU上的访存方法
    3.
    发明公开

    公开(公告)号:CN104199782A

    公开(公告)日:2014-12-10

    申请号:CN201410419711.2

    申请日:2014-08-25

    IPC分类号: G06F12/02

    摘要: 本发明公开了一种GPU上的访存方法。本发明对流处理器中发出的请求进行访存融合;流处理器将融合后的访存请求发送到相应内存中;内存中将融合后的访存请求进行拆分,并读出数据;内存中将读出数据形成数据块返回到流处理器;流处理器对发回的数据块进行处理、存储。本发明通过对访存地址具有相同间隔的访存请求进行融合,提高了访存效率,隐藏了内存延迟,提高了GPU的综合性能。可将本方法与现有方法结合使用,从而使得程序有一定程度的性能提升。

    一种GPGPU寄存器缓存的实现方法

    公开(公告)号:CN104182281A

    公开(公告)日:2014-12-03

    申请号:CN201410418801.X

    申请日:2014-08-25

    IPC分类号: G06F9/50 G06F12/08

    CPC分类号: Y02D10/22 Y02D10/36

    摘要: 本发明公开了一种GPGPU寄存器缓存的实现方法。各个流处理器移除原有寄存器文件,增加用于存储正在执行线程所需寄存器的寄存器缓存,线程执行前从内存中加载寄存器数据到寄存器缓存。在线程执行所需的寄存器能保存在流处理器的寄存器缓存中的前提下,从所有可执行的线程中选择线程数量最多的线程组合执行,从内存中加载选择的线程组合中每个线程所使用的寄存器数据到寄存器缓存,然后以任意方式对线程组合中的线程进行选择执行,当选择的线程组合中所有线程都无法执行时,重新选择另一组线程。本发明减少流处理器寄存器文件所需存储空间,降低能耗和面积,解除流处理器寄存器数量不足的限制,提高系统效率。