一种用于区块链的处理装置及方法

    公开(公告)号:CN110211618A

    公开(公告)日:2019-09-06

    申请号:CN201910505407.2

    申请日:2019-06-12

    Abstract: 本发明提供了一种用于区块链的处理装置及方法,该装置包括:阻变存储器,其包括用于存储待处理的随机数的多个存储单元,以及用于读出或者写入数据位的字线和位线;字线控制逻辑,用于控制阻变存储器中字线的选通;位线控制逻辑,用于控制阻变存储器中位线的选通;数据获取单元,其连接到所述阻变存储器并用于从阻变存储器中接收所选通的字线上的随机数的一个或者多个数据位的输出,获得由所述字线选通的随机数的数据位的叠加值;计算及控制单元,被配置为根据数据获取单元生成的随机数数据位的叠加值进行随机数的筛选,获得随机数有效组。本发明可以减少CPU处理的数据的范围和数据量、对访存带宽的需求、计算负载、功耗,提高区块链应用处理能力。

    基于深度线索的视频场景检索方法和系统

    公开(公告)号:CN109241342A

    公开(公告)日:2019-01-18

    申请号:CN201810811468.7

    申请日:2018-07-23

    Abstract: 本发明涉及一种基于深度线索的视频场景检索方法和系统,包括:获取样本视频,并将样本视频作为输入视频;将输入视频分割为场景片段,根据场景片段的视频场景信息,提取深度线索,对深度线索构成的空间数据降维,作为空间信息描述子;对输入视频进行帧采样得到关键帧,提取关键帧的特征,作为彩色信息描述子;建立空间信息描述子与彩色信息描述子的索引关系,得到场景描述子;对所有样本视频的场景描述子建立视频场景特征库;获取待检索视频,并作为输入视频,得到待检索视频的空间描述子与彩色信息描述子,并根据待检索视频的空间描述子,检索视频场景特征库,得到初步检索结果,对初步检索结果进行彩色特征筛选得到待检索视频的最终检索结果。

    片上网络路由器通道资源的贪婪分配方法、装置及路由器

    公开(公告)号:CN106453072A

    公开(公告)日:2017-02-22

    申请号:CN201610460938.0

    申请日:2016-06-22

    CPC classification number: H04L45/00 H04L45/60

    Abstract: 本发明提供了一种片上网络路由器通道资源的贪婪分配方法,适用于片上网络技术领域,所述贪婪分配方法在交叉开关分配阶段为路由器的内部的输入端口与输出端口进行映射之前进行,包括:预处理步骤,当数据包进入所述输入端口的子通道和虚通道中时,将数据包信息进行归类处理得到预处理信息表;执行步骤,根据所述预处理信息表以及所述数据包对应的所述输出端口的大小,选择最大限度多个所述数据包匹配所述子通道和所述输出端口。同时还提供一种片上网络路由器通道资源的贪婪分配装置。借此,本发明利用贪婪算法思想对输入端口和输出端口之间进行通道的匹配,达到趋向于最优的映射,提高通道的利用率。

    基于数据流架构加速器的注意力机制融合方法及装置

    公开(公告)号:CN119940434A

    公开(公告)日:2025-05-06

    申请号:CN202510009132.9

    申请日:2025-01-03

    Abstract: 本发明提出一种基于数据流架构加速器的注意力机制融合方法和装置,包括用于在GPDPU加速器上加速Attention计算的方法,该方法根据Attention中embedding的维度和输入序列长度的乘积来选择融合方案,对于维度较小的计算,通过预先传入转置数据的方式将所有操作融合在同一个核函数中,从而减少配置指令的时间和访存开销,对于维度较大的计算,将输入数据分块传入暂存数据缓存SPM的存储器中用于计算,将Attention的计算步骤融合为两个复用程度很高的核函数减少指令信息的配置时间。

    一种流图程序生成方法和采用该方法的粗粒度数据流装置

    公开(公告)号:CN118152090A

    公开(公告)日:2024-06-07

    申请号:CN202410156325.2

    申请日:2024-02-04

    Abstract: 本发明提供了一种应用于处理器的流图程序生成方法,其中,流图程序为指示粗粒度数据流架构下计算任务的数据流图,所述粗粒度数据流架构包括执行阵列,所述执行阵列包括多个执行单元,所述方法包括对算子任务执行如下步骤:S1、获取粗粒度数据流架构的参数,所述参数至少包括执行单元个数、可同时支持的并行任务个数;S2、基于算子任务并行计算特征以及所述步骤S1中获取的架构参数,将算子任务划分为一个或多个分任务,其中,分任务个数应小于或等于所述粗粒度数据流架构可同时支持的并行任务个数;S3、将每个分任务进一步划分成多个子任务,每个子任务执行不同的一个或多个功能;S4、按照预设的规则对每个子任务进行流图程序编码。

    一种数据流众核处理器的数据预取方法及处理器

    公开(公告)号:CN118132462A

    公开(公告)日:2024-06-04

    申请号:CN202410263613.8

    申请日:2024-03-08

    Abstract: 本发明提供了一种数据流众核处理器的数据预取方法及处理器,方法包括:对于待执行的程序,将程序执行所需的数据划分为可预取数据和不可预取数据;对于可预取数据,在程序执行前加载至处理器的片上存储,且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态;对于不可预取数据,在程序执行过程中按需加载至片上存储,有效地减少了对片外存储的访问请求次数,降低了平均访问延迟;并且在程序执行前将片上存储中存有所述可预取数据的缓存路设为不可被覆盖的只读状态,使得可预取数据在程序执行完毕前被稳定地保持在片上存储中。

    一种基于卷积神经网络的图像检测方法及系统

    公开(公告)号:CN112288085B

    公开(公告)日:2024-04-09

    申请号:CN202011147836.6

    申请日:2020-10-23

    Abstract: 本发明提出一种卷积神经网络加速方法及系统,包括将待特征分析的图像作为输入激活输入卷积神经网络,分解该卷积神经网络中滤波器的权值向量,得到滤波器中权值对应的符号向量;通过符号向量与输入激活向量执行卷积运算,得到第一卷积结果,通过补偿因子与输入激活向量执行卷积运算,得到第二卷积结果,将该第一卷积结果和第二卷积结果相加,得到预测结果;该卷积神经网络执行卷积计算时根据该预测结果跳过0值相关的运算,得到卷积结果。本发明可预知输出激活的稀疏度,以指导原始的神经网络运算跳过0值相关的运算,从而减少原始网络的计算量,节省计算资源、降低功耗并提升性能。

Patent Agency Ranking