面向CPU+GPU处理器的混合粒度一致性维护方法

    公开(公告)号:CN104615576B

    公开(公告)日:2017-03-15

    申请号:CN201510092458.9

    申请日:2015-03-02

    IPC分类号: G06F15/16

    摘要: 本发明公开了面向CPU+GPU处理器的混合粒度一致性维护方法,目的是解决CPU簇和GPU簇的二级缓存的一致性问题。技术方案是设计一个由粗粒度的域目录和细粒度的块目录组成的双目录结构,双目录结构嵌在L2Cache和主存通道之间,根据CPU簇和GPU簇发出的不同访存请求类型,若访存请求的初始来源为GPU,则采用GPU请求维护流程,若访存请求的初始来源为GPU,启动CPU请求维护流程,通过域目录和块目录相互通信并协作,完成一致性信息的更新和维护以及数据的传递,保证处理器访存的一致性。本发明能有效过滤GPU应用对一致性资源的竞争、减少GPU对CPU性能干扰、保证CPU数据精确记录,极大地提升CPU+GPU异构多核系统的处理性能,且能满足CPU应用对重要数据精细跟踪的需求。

    一种用于快速傅里叶变换的数据存储及调度方法

    公开(公告)号:CN105847213A

    公开(公告)日:2016-08-10

    申请号:CN201610173480.0

    申请日:2016-03-24

    IPC分类号: H04L27/26

    CPC分类号: H04L27/263

    摘要: 一种用于快速傅里叶变换的数据存储及调度方法,步骤为:S1:数据的输入端口从Data输入;输入对应的数据存储配置信息,数据先放入一个深度为4的存储块中;S2:在深度为4的数据队列中,假设当前队列的状态位是满状态,则开始将队列中的数据四路输入到DM模块中;S3:当前的DM模块中的数据数量达到要求时,启动DM模块,通过配置信息,将当前的4*4的空间数据流出;S4:经过一轮复数乘法与基四变换,数据通过队列开始输入到DM模块;S5:DM配置信息进行改变,修改输入端口;S6:通过改变DM配置信息改变输出,将输出端口修改后输出到数据队列中,得到正序的数据结果。本发明具有能使数据输出延时时钟数减少、使资源消耗减少等优点。

    面向CPU+GPU处理器的混合粒度一致性维护方法

    公开(公告)号:CN104615576A

    公开(公告)日:2015-05-13

    申请号:CN201510092458.9

    申请日:2015-03-02

    IPC分类号: G06F15/16

    摘要: 本发明公开了面向CPU+GPU处理器的混合粒度一致性维护方法,目的是解决CPU簇和GPU簇的二级缓存的一致性问题。技术方案是设计一个由粗粒度的域目录和细粒度的块目录组成的双目录结构,双目录结构嵌在L2Cache和主存通道之间,根据CPU簇和GPU簇发出的不同访存请求类型,若访存请求的初始来源为GPU,则采用GPU请求维护流程,若访存请求的初始来源为GPU,启动CPU请求维护流程,通过域目录和块目录相互通信并协作,完成一致性信息的更新和维护以及数据的传递,保证处理器访存的一致性。本发明能有效过滤GPU应用对一致性资源的竞争、减少GPU对CPU性能干扰、保证CPU数据精确记录,极大地提升CPU+GPU异构多核系统的处理性能,且能满足CPU应用对重要数据精细跟踪的需求。