一种应对非规则访存的数据预取器

    公开(公告)号:CN118132464A

    公开(公告)日:2024-06-04

    申请号:CN202410122002.1

    申请日:2024-01-29

    摘要: 一种应对非规则访存的数据预取器,包括:访问索引表、访问目标表、差分匹配模块、索引队列、间接访问候选记分牌、地址生成器、间接访问关系表、预取状态处理寄存器、重复过滤器、连续地址过滤器和范围预取表,该数据预取器用于监听计算核心与第一级缓存、第一级缓存和第二级缓存之间的访问请求和数据响应的事件。该数据预取器可应用在各类采用层级存储设计的通用计算架构中,实现对非规则间接访问的模式捕获和数据预取,减少非规则访存带来的长延时存储访问开销,提高计算架构的每周期执行指令数(IPC)。

    一种用于神经网络推理加速的低功耗浮点乘累加运算方法

    公开(公告)号:CN115374904A

    公开(公告)日:2022-11-22

    申请号:CN202210924134.7

    申请日:2022-08-02

    摘要: 本公开揭示了一种用于神经网络推理加速的低功耗浮点乘累加运算方法,通过对输入的浮点数进行预处理,在计算前对小数部分进行舍入并调整其指数位,对可能会被舍入的数据进行预先的舍入和规整,省去对不必要精度的计算。同时,为了累加电路能够快速执行,采用科学技术法表示的指数的小数部分放弃原有的原码表示方法,转而采用补码表示方法。本公开利用乘累加运算的特点,使用消耗资源较少的定点运算资源实现接近浮点运算的精度,从而解决了神经网络推理过程中计算精度与硬件实现复杂度的平衡问题。

    一种卷积运算的硬件自动padding的方法

    公开(公告)号:CN115374394A

    公开(公告)日:2022-11-22

    申请号:CN202210924136.6

    申请日:2022-08-02

    IPC分类号: G06F17/15 G06N3/04

    摘要: 本公开揭示卷积运算的硬件自动padding的方法及其数据存储格式。其中,该数据存储格式在数据存储过程中,会将整个输入数据ifm进行分段,每段数据进行8等分切分,得到8组数据,然后对每组数据进行等位置抽取,等位置数据排为一列,进行顺序存储。如此,这种存储格式具有更好的局部性。相比现有技术中的HWC格式,本公开将此种存储格式命名为HWC88格式。对于所述硬件自动padding的方法,在采用HWC88存储格式的数据左右两侧,通过对原数据进行复制、移位后自动补足padding数据,从而快速进行卷积运算,其中在显式存储padding时,将padding部分视为正常数据,不需要额外计算padding地址。