基于通道优先计算的稀疏数据加速计算方法和装置

    公开(公告)号:CN118394505A

    公开(公告)日:2024-07-26

    申请号:CN202410442448.2

    申请日:2024-04-12

    IPC分类号: G06F9/50

    摘要: 本申请涉及一种基于通道优先计算的稀疏数据加速计算方法和装置。所述方法包括:对待处理的稀疏数据进行编码处理和分块处理,得到多个候选编码块;其中,所述待处理的稀疏数据的数量大于计算单元的数量;分别确定各所述候选编码块的非零数据个数和非零数据位置;基于所述计算单元的数量和所述非零数据个数,从多个所述候选编码块中选择出每轮处理的目标编码块;在每轮处理中,根据所述非零数据位置对所述目标编码块进行处理,得到处理后的稀疏数据。采用本方法能够减少资源浪费。

    基于可重构处理器架构设计的信道编码方法及装置

    公开(公告)号:CN116566544A

    公开(公告)日:2023-08-08

    申请号:CN202310347187.1

    申请日:2023-04-03

    申请人: 清华大学

    IPC分类号: H04L1/00

    摘要: 本申请涉及一种基于可重构处理器架构设计的信道编码方法及装置。所述方法包括:根据待编码信息码字包括的各子信息码字和各子信息码字对应的行校验子矩阵,确定行校验子矩阵对应的中间变量子矩阵,根据各行校验子矩阵和待编码信息码字对应的编码信息码字之间的关系、各中间变量子矩阵,确定各中间变量子矩阵对应的子校验位码字,根据各中间变量子矩阵对应的子校验位码字和各子信息码字,得到待编码信息码字对应的编码信息码字。采用本方法能够提高信道编码的效率。

    面向人工智能芯片的矢量引擎处理方法和装置

    公开(公告)号:CN116484909A

    公开(公告)日:2023-07-25

    申请号:CN202310323014.6

    申请日:2023-03-29

    申请人: 清华大学

    摘要: 本申请涉及一种面向人工智能芯片的矢量引擎处理方法和装置。应用于芯片中的矢量引擎,所述方法包括:接收通道配置指令,根据该通道配置指令将该矢量引擎的指令通道的数量配置为第一数量;将各该指令通道内并行指令的数量配置为第二数量;基于该第一数量的指令通道以及各该指令通道内该第二数量的并行指令,对目标数据执行矢量运算处理,该目标数据为该芯片当前处理的人工神经网络对应的运算数据。采用本方法能够提升人工智能芯片内部的计算处理能力以满足人工神经网络的计算需求。

    面向人工智能芯片的智能引擎处理方法和装置

    公开(公告)号:CN116468078A

    公开(公告)日:2023-07-21

    申请号:CN202310323951.1

    申请日:2023-03-29

    申请人: 清华大学

    IPC分类号: G06N3/0464 G06N3/063 G06N3/08

    摘要: 本申请涉及一种面向人工智能芯片的智能引擎处理方法和装置,应用于芯片中的智能引擎,所述智能引擎包括阵列排布的多个计算单元,所述方法包括:所述智能引擎中的目标计算单元接收配置更改指令,其中,所述目标计算单元为所述多个计算单元中的任一个;所述目标计算单元根据所述配置更改指令读取配置更改数据;所述目标计算单元基于所述配置更改数据对所述目标计算单元中预置的神经网络计算参数进行调整处理,并基于调整处理后的神经网络计算参数进行神经网络运算。本申请能够实现灵活调整参数。

    面向人工智能芯片的混合引擎智能计算方法和装置

    公开(公告)号:CN116402091A

    公开(公告)日:2023-07-07

    申请号:CN202310323922.5

    申请日:2023-03-29

    申请人: 清华大学

    摘要: 本申请涉及一种面向人工智能芯片的混合引擎智能计算方法和装置。该数据处理方法应用于处理芯片,处理芯片包括标量处理单元和计算单元;该方法包括:在接收到处理指令的情况下,从标量处理单元和计算单元中确定处理处理指令的第一目标处理单元;处理指令用于指示运行目标神经网络模型;利用第一目标处理单元对处理指令进行处理,得到处理指令对应的处理信息;处理信息包括控制信息和数据信息;利用第二目标处理单元和处理信息运行目标神经网络模型,得到目标神经网络模型的运行结果;第二目标处理单元包括第一目标处理单元。本申请可以改善人工智能芯片在运行神经网络模型的过程中容易产生过热等问题。

    面向人工智能芯片的标量引擎处理方法和装置

    公开(公告)号:CN116400926A

    公开(公告)日:2023-07-07

    申请号:CN202310319068.5

    申请日:2023-03-29

    申请人: 清华大学

    摘要: 本申请涉及一种面向人工智能芯片的标量引擎处理方法和装置。所述方法包括:芯片中的上层模块获取待部署于芯片中的人工神经网络模型;上层模块基于芯片中的标量引擎所内置的指令集,对人工神经网络模型进行转换处理,得到人工神经网络模型对应的多个目标指令,并将多个目标指令发送至标量引擎;标量引擎执行多个目标指令,以在芯片内实现人工神经网络模型对应的编译处理。采用本方法能够提升人工智能芯片对人工神经网络模型的片内编译处理灵活性。

    异构加速处理器及数据计算方法

    公开(公告)号:CN114595813B

    公开(公告)日:2024-09-06

    申请号:CN202210132954.2

    申请日:2022-02-14

    申请人: 清华大学

    IPC分类号: G06N3/063 G06N3/0464

    摘要: 本发明公开了一种异构加速处理器及数据计算方法,该异构加速处理器包括:计算模块,包括卷积PE阵列和矢量计算控制单元;存储模块RAM用于存储数据;CPU用于将矢量计算指令发送至计算模块;卷积PE阵列包括多个PE单元,所述PE单元用于对原始数据进行神经网络卷积计算;所述数据整理变换模块用于对计算模块输出的中间数据进行整理变换,获得结果数据;所述矢量计算控制单元用于控制至少一个PE单元进行矢量计算;所述PE单元还用于在矢量计算控制单元的控制下,对原始数据或中间数据进行矢量计算;在接收到矢量计算指令后,对矢量计算指令中的数据进行矢量计算。本发明可以灵活地进行神经网络卷积计算和矢量计算,且可避免资源浪费。

    一种数据处理装置和方法
    9.
    发明公开

    公开(公告)号:CN116820733A

    公开(公告)日:2023-09-29

    申请号:CN202210264771.6

    申请日:2022-03-17

    发明人: 李诚 位经传 迟朋

    摘要: 本申请提供了一种数据处理装置和方法,涉及图像处理领域,该数据处理装置包括控制模块和计算模块,控制模块用于根据待执行的计算过程生成指示信息;计算模块包括M个可重构计算单元,用于通过M个可重构计算单元中的以下至少一个计算单元执行计算过程:乘累加计算单元、激活量化计算单元或池化计算单元,该至少一个计算单元是根据指示信息确定的。本申请实施例的方案可以将多个计算过程在一个装置中完成,具备较好的资源利用率。此外,当计算模块包括多个可重构计算单元时,多个可重构计算单元可以同时对待处理数据进行计算,从而能够进一步提高目标检测的效率。

    基于可重构处理器架构设计的信道译码装置及方法

    公开(公告)号:CN116545578A

    公开(公告)日:2023-08-04

    申请号:CN202310347682.2

    申请日:2023-04-03

    申请人: 清华大学

    IPC分类号: H04L1/00

    摘要: 本申请涉及一种基于可重构处理器架构设计的信道译码装置及方法。所述信道译码装置包括第一计算器、第二计算器和输出装置;第一计算器,用于根据预设校验矩阵、各变量节点对应的目标变量和中间变量,确定当前次译码操作中各变量节点的外信息;第二计算器,用于根据预设校验矩阵、当前次译码操作中各变量节点对应的外信息和目标变量,确定与各变量节点对应的校验节点的校验信息;输出装置,用于根据各校验节点的校验信息,确定各待译码信息对应的目标译码信息。提高了信道译码的效率。