面向CPU+GPU处理器的混合粒度一致性维护方法

    公开(公告)号:CN104615576B

    公开(公告)日:2017-03-15

    申请号:CN201510092458.9

    申请日:2015-03-02

    IPC分类号: G06F15/16

    摘要: 本发明公开了面向CPU+GPU处理器的混合粒度一致性维护方法,目的是解决CPU簇和GPU簇的二级缓存的一致性问题。技术方案是设计一个由粗粒度的域目录和细粒度的块目录组成的双目录结构,双目录结构嵌在L2Cache和主存通道之间,根据CPU簇和GPU簇发出的不同访存请求类型,若访存请求的初始来源为GPU,则采用GPU请求维护流程,若访存请求的初始来源为GPU,启动CPU请求维护流程,通过域目录和块目录相互通信并协作,完成一致性信息的更新和维护以及数据的传递,保证处理器访存的一致性。本发明能有效过滤GPU应用对一致性资源的竞争、减少GPU对CPU性能干扰、保证CPU数据精确记录,极大地提升CPU+GPU异构多核系统的处理性能,且能满足CPU应用对重要数据精细跟踪的需求。

    基于超前迭代的迭代结构QR分解装置及分解方法

    公开(公告)号:CN105847200B

    公开(公告)日:2019-02-15

    申请号:CN201610172197.6

    申请日:2016-03-24

    IPC分类号: H04L25/03

    摘要: 一种基于超前迭代的迭代结构QR分解装置及分解方法,分解装置用来对n×n的矩阵A进行QR分解,它包括三角处理模块、1个对角处理模块、(n‑1)个迭代处理模块;第一多路选择器从外部接收到矩阵A的第一个列向量a1,从第一个迭代处理模块的aj3p+1端口接收到信号作为输入,输出端口与对角处理模块相连;第二多路选择器从外部接收到矩阵A的第二个列向量a2,从第二个迭代处理模块的aj3p+1端口接收到信号作为输入,输出端与第一个迭代处理模块相连;对角处理模块的aj端口以及所有迭代处理模块的ajp端口均与第一多路选择器相连。分解方法基于上述分解装置来实施。本发明具有原理简单、易实现、分解速度快、效率高等优点。

    一种多模式自适应切换处理器

    公开(公告)号:CN105808351B

    公开(公告)日:2018-11-06

    申请号:CN201610126001.X

    申请日:2016-03-06

    IPC分类号: G06F9/50 G06F1/32

    摘要: 本发明公开了一种多模式自适应切换处理器,解决处理器在高吞吐,低功耗和高可靠性之间进行折衷和平衡的问题。本发明由指令池、第一数据缓存、第一解耦缓存、计算池、第二解耦缓存、存储池、自适应控制模块组成,指令池由指令高速缓存、译码单元和分派单元组成;第一解耦缓存由3个指令缓存组成;计算池由3组计算单元组成;第二解耦缓存由3个数据缓存组成;存储池由3个子寄存器文件和3个子数据存储器组成;自适应控制模块是软件,根据环境参数向分派单元、第一数据缓存、计算池、存储池发送不同的开关信号,改变分派单元分派策略,实现吞吐率‑功耗‑可靠性三种模式自适应切换,使得处理器在这三种模式下的总体效能达到动态最优。

    基于超前迭代的迭代结构QR分解装置及分解方法

    公开(公告)号:CN105847200A

    公开(公告)日:2016-08-10

    申请号:CN201610172197.6

    申请日:2016-03-24

    IPC分类号: H04L25/03

    摘要: 一种基于超前迭代的迭代结构QR分解装置及分解方法,分解装置用来对n×n的矩阵A进行QR分解,它包括三角处理模块、1个对角处理模块、(n?1)个迭代处理模块;第一多路选择器从外部接收到矩阵A的第一个列向量a1,从第一个迭代处理模块的aj3p+1端口接收到信号作为输入,输出端口与对角处理模块相连;第二多路选择器从外部接收到矩阵A的第二个列向量a2,从第二个迭代处理模块的aj3p+1端口接收到信号作为输入,输出端与第一个迭代处理模块相连;对角处理模块的aj端口以及所有迭代处理模块的ajp端口均与第一多路选择器相连。分解方法基于上述分解装置来实施。本发明具有原理简单、易实现、分解速度快、效率高等优点。

    一种带有局部信息的排名列表聚合方法

    公开(公告)号:CN105825324A

    公开(公告)日:2016-08-03

    申请号:CN201610136641.9

    申请日:2016-03-10

    IPC分类号: G06Q10/06

    CPC分类号: G06Q10/06393

    摘要: 本发明公开了一种带有局部信息的排名列表聚合方法,目的是降低对原始排名列表的要求,提高聚合速度和准确性。技术方案为:先将初始排名列表矩阵化,得出排名矩阵;计算每个被排名对象的排名分别被其余被排名对象打败的次数、分别打败其余被排名对象的次数,得出优序矩阵;接着求得各个被评价对象的加权出度和加权入度,并求得各个被评价对象的加权出度入度比;最后将每个被排名对象的加权出度入度比进行降序排列,根据降序排列得出排名列表聚合结果。本发明实现了对带有局部信息的排名列表进行聚合,降低了对原始排名列表的要求,不需要获得的排名列表都是全局信息,提高了排名列表聚合方法的聚合速度和聚合准确性。

    一种多模式自适应切换处理器

    公开(公告)号:CN105808351A

    公开(公告)日:2016-07-27

    申请号:CN201610126001.X

    申请日:2016-03-06

    IPC分类号: G06F9/50 G06F1/32

    摘要: 本发明公开了一种多模式自适应切换处理器,解决处理器在高吞吐,低功耗和高可靠性之间进行折衷和平衡的问题。本发明由指令池、第一数据缓存、第一解耦缓存、计算池、第二解耦缓存、存储池、自适应控制模块组成,指令池由指令高速缓存、译码单元和分派单元组成;第一解耦缓存由3个指令缓存组成;计算池由3组计算单元组成;第二解耦缓存由3个数据缓存组成;存储池由3个子寄存器文件和3个子数据存储器组成;自适应控制模块是软件,根据环境参数向分派单元、第一数据缓存、计算池、存储池发送不同的开关信号,改变分派单元分派策略,实现吞吐率?功耗?可靠性三种模式自适应切换,使得处理器在这三种模式下的总体效能达到动态最优。