用于处理器的基于访问映射-图案匹配的预取单元

    公开(公告)号:CN105378684A

    公开(公告)日:2016-03-02

    申请号:CN201480040220.5

    申请日:2014-06-17

    申请人: 苹果公司

    IPC分类号: G06F12/0862

    摘要: 在一个实施例中,处理器可实现基于访问映射-图案匹配(AMPM)的预取器,其中针对一些高速缓存块,该图案可包括通配符。通配符可匹配针对对应高速缓存块的任何访问(例如,没有访问、按需访问、预取、成功预取等)。此外,具有不规则步幅的图案和/或不规则访问图案可被包括在匹配图案中并且可被检测以用于预取生成。在一个实施例中,AMPM预取器可实现用于大流预取的链接访问映射。如果检测到流,则AMPM预取器可针对该流来分配映射条目对并且可重新使用该映射条目对以用于该流内的后续访问映射区域。在一些实施例中,品质因子可与每个访问映射相关联并且可控制预取生成的速率。

    多级指令高速缓存预取的方法、系统与设备

    公开(公告)号:CN103218309B

    公开(公告)日:2016-01-27

    申请号:CN201210520348.4

    申请日:2012-12-06

    申请人: 辉达公司

    IPC分类号: G06F12/0862 G06F9/38

    摘要: 本发明的一个实施例阐释了在多级高速缓存中预取指令的改进方式。获取单元基于伪随机数生成器和与当前指令L1高速缓存线相对应的扇区的函数,来启动预取操作以转移多个高速缓存线的集合中的一个。获取单元根据某一概率函数从多个高速缓存线的集合中选择预取目标。如果当前指令L1高速缓存370位于相应L1.5高速缓存线的第一扇区内,那么所选择的预取目标位于下一个L1.5高速缓存线内的扇区。结果是,改善了指令L1高速缓存命中率并且指令获取延迟减小,甚至在处理器以高速率消耗指令L1高速缓存中的指令的情况下。

    一种实现数据预取的方法及装置

    公开(公告)号:CN102521158B

    公开(公告)日:2014-09-24

    申请号:CN201110415405.8

    申请日:2011-12-13

    IPC分类号: G06F12/08

    摘要: 本发明提供了一种实现数据预取的方法及装置,其中预取器装置包括:访存模式识别单元将全局失效地址流划分为局部失效地址流,按时间顺序将局部失效地址流中最近发生的两个缓存失效的地址信息记录为历史访存信息,并根据该记录捕获跨距访存模式并生成相应的预取地址。本发明通过改善差值相关预取器的存储利用效率,并通过减少对预取器性能提升没有贡献的冗余预取,使得预取器在相同存储开销的情况下能够获得更好的性能优化效果,同时可有效降低预取器访问片上缓存的带宽需求和功耗开销。

    预取数据的系统和方法

    公开(公告)号:CN101751246A

    公开(公告)日:2010-06-23

    申请号:CN200910208364.8

    申请日:2009-11-12

    IPC分类号: G06F9/34 G06F12/08

    摘要: 本发明涉及一种预取数据的系统和方法。提供了一种与预取高速缓存通信以提高系统性能的预取控制器。在某些实施例中,所述预取控制器可包括指令查找表ILT,其配置为接收包含第一指令ID和第一未命中数据地址的第一元组。所述预取控制器还可包括元组历史队列THQ,其配置为接收指令/步长元组,通过从第一未命中数据地址减去最后数据存取地址生成所述指令/步长元组。所述预取控制器还可包括序列预测表SPT,其与所述元组历史队列和所述指令查找表通信。所述预取控制器还可包括加法器,其与所述指令查找表和所述序列预测表通信并被配置为生成预测的预取地址和将所述预测的预取地址提供给预取高速缓存。许多其他实施例也在本发明的范围之内。