基于斐波那契编码的存算一体神经网络加速方法及加速器

    公开(公告)号:CN119416845A

    公开(公告)日:2025-02-11

    申请号:CN202411551391.6

    申请日:2024-11-01

    Abstract: 本发明提出一种基于斐波那契编码的存算一体神经网络加速方法和加速器,包括:存算一体神经网络加速器的斐波那契编码器将参与神经网络运算任务的激活值和权重值从二进制编码为斐波那契编码,得到斐波那契激活和斐波那契权重,存算一体神经网络加速器中存算一体单元的DAC将斐波那契激活转化为多个模拟电压,并分别施加到存算一体单元中SRAM阵列每一行的字线上;SRAM阵列的每个单元将输入的模拟电压乘以相应的斐波那契权重,得到中间运算结果,SRAM阵列每一列的加法器对中间运算结果进行重新分配电荷以完成内积的累加操作,并将累加操作结果通过存算一体单元的ADC转换为斐波那契编码的数字格式,作为神经网络运算任务的运算结果。

    用于分形智能处理器的分形可重配指令集

    公开(公告)号:CN111831331B

    公开(公告)日:2024-04-05

    申请号:CN202010688961.1

    申请日:2020-07-16

    Abstract: 本公开提供一种用于分形智能处理器的分形可重配指令集,该分形可重配指令集将本地指令或计算原语映射为用于分形运算的分形指令,该本地指令作用于向量数据或标量数据。该分形可重配指令集包括间接指令域。对应的,分形智能处理器的控制系统包括分解模块、降级模块及记录模块;分解模块用于对分形可重配指令集进行串行分解;降级模块用于对串行分解后的串行分解子指令进行降级;分解模块还用于对降级后的串行分解子指令进行并行分解。记录模块,用于在每一次串行分解之前,替换所间接指令域的值,以实现对分形可重配指令集的动态控制。该分形可重配指令抽象层次高,表达灵活性强,结合控制系统的硬件架构支持,可解决计算过程中的失效问题。

    因果关系驱动的分层强化学习框架及分层强化学习方法

    公开(公告)号:CN115271090A

    公开(公告)日:2022-11-01

    申请号:CN202210700253.4

    申请日:2022-06-20

    Abstract: 本发明提出一种基于因果关系驱动的分层强化学习框架,包括:因果关系发现模块,用于获取智能体的强化学习环境中各环境变量之间的因果关系,并构建为因果关系图;子目标分层结构构造模块,用于根据该环境变量的变化函数,构建分层强化学习的子目标集合,选取该环境变量中的可控变量,通过该因果关系图从该子目标集合中选出与该可控变量关联的子目标为可达子目标,以所有该可达子目标的逻辑关系为该分层强化学习的分层关系。还提出一种基于因果关系驱动的分层强化学习方法,以及一种数据处理装置。

    一种相对位置编码方法及系统
    17.
    发明公开

    公开(公告)号:CN114417847A

    公开(公告)日:2022-04-29

    申请号:CN202111595100.X

    申请日:2021-12-24

    Abstract: 本发明提出一种相对位置编码方法和系统,包括:构建包括多头注意层的递归神经网络,获取待相对位置编码的数据序列,将该数据序列进行拆分后并行输入该多头注意层,该多头注意层通过计算拆分后数据在该数据序列中的相对位置,为每一个拆分后数据分配注意力分数,并基于各拆分后数据对应的注意力分数,生成各拆分后数据的相对位置编码。

    分形计算智能处理器、分形计算智能处理方法

    公开(公告)号:CN111857834A

    公开(公告)日:2020-10-30

    申请号:CN202010689150.3

    申请日:2020-07-16

    Abstract: 本公开提供了一种分形计算智能处理器、分形计算智能处理方法,分形计算智能处理器包括:至少两个分形计算子单元,用于根据分形计算指令进行分形计算,其中,各个所述分形计算子单元的结构之间具备层次同性;所述分形计算子单元的数量根据执行的所述分形计算对应的程序设定;控制器,用于根据所述分形计算子单元的数量及硬件资源生成分形计算指令,并发送所述分形计算指令至所述分形计算子单元;存储器,用于存储所述分形计算所需数据及分形计算结果;规约运算器,用于根据规约运算指令对各个所述分形计算子单元的分形计算结果进行规约运算。本技术方案可实现串行编程、并行执行,从而解决通用领域并行编程难题。

    计数方法及装置
    20.
    发明授权

    公开(公告)号:CN108052984B

    公开(公告)日:2019-11-08

    申请号:CN201711467274.1

    申请日:2017-10-30

    Abstract: 本公开提供了一种计数方法,包括:对一FAST R‑CNN或YOLO深度神经网络进行训练;以及利用训练后的FAST R‑CNN或YOLO深度神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本公开计数方法及装置应用范围广,可针对任意计数对象进行计数,节省人力并且提供了更高的通用性。

Patent Agency Ranking