深度学习处理装置、方法、设备和存储介质

    公开(公告)号:CN113222101A

    公开(公告)日:2021-08-06

    申请号:CN202010080940.1

    申请日:2020-02-05

    IPC分类号: G06N3/04 G06N3/08 G06N20/00

    摘要: 本公开的实施例提出了深度学习处理装置、方法、设备和存储介质,涉及人工智能领域。一种深度学习处理装置包括至少一个矩阵乘加模块,被配置为执行卷积神经网络中的卷积层的卷积核参数值矩阵与第一误差梯度值矩阵的矩阵乘加运算,得到多个中间矩阵;存储装置,用于存储多个中间矩阵而无需对多个中间矩阵中的元素进行重新整形;以及多个矩阵累加模块,被配置为从存储装置读取多个中间矩阵并且以并行方式按卷积层的卷积方案执行基于多个中间矩阵的矩阵累加运算,得到针对卷积层的第二误差梯度值矩阵。这样的深度学习处理装置可以显著提高卷积反向操作的计算效率,在计算速度和耗能方面均能得到改进。

    业务调度方法、装置和系统

    公开(公告)号:CN106209682B

    公开(公告)日:2019-04-30

    申请号:CN201610539215.X

    申请日:2016-07-08

    发明人: 王勇 欧阳剑 漆维

    IPC分类号: H04L12/863

    摘要: 本申请公开了业务调度方法、装置和系统。所述方法的一具体实施方式包括:监测等待队列中是否存在业务请求,其中等待队列用于存储待执行的业务请求;响应于确定等待队列中存在业务请求,交换运行队列和等待队列,其中运行队列用于存储当前执行的业务请求;将交换后的运行队列中的业务请求合并后生成待处理请求集合并发送至业务处理接口,以通过业务处理接口对待处理请求集合进行批量处理;在待处理请求集合中的业务请求处理完毕后,清空交换后的运行队列。该实施方式能够根据业务需求和硬件处理能力自适应调整批处理数量,提升了业务处理效率。

    数据处理方法和装置
    5.
    发明授权

    公开(公告)号:CN105893159B

    公开(公告)日:2018-06-19

    申请号:CN201610454483.1

    申请日:2016-06-21

    发明人: 欧阳剑 漆维 王勇

    IPC分类号: G06F9/50

    摘要: 本申请公开了数据处理方法和装置。所述方法的一具体实施方式包括:对接收到的待处理输入数据进行预处理;根据预处理的结果以及通过线性拟合激活函数得到的结果获得所述待处理输入数据的配置参数的存储地址,其中,配置参数是根据激活函数的曲线特性预先设置的;根据所述存储地址获取所述待处理输入数据的配置参数;根据所述待处理输入数据的配置参数以及预先设定的电路结构对所述待处理输入数据的预处理结果进行处理,得到处理结果。该实施方式实现了使用配置参数和预先设定的电路结构实现对待处理输入数据的处理,不需要使用用于实现激活函数的专用电路,从而简化了电路结构,且同时可以支持多种激活函数,提高了灵活性。

    业务调度方法、装置和系统

    公开(公告)号:CN106209682A

    公开(公告)日:2016-12-07

    申请号:CN201610539215.X

    申请日:2016-07-08

    发明人: 王勇 欧阳剑 漆维

    IPC分类号: H04L12/863

    CPC分类号: H04L47/62

    摘要: 本申请公开了业务调度方法、装置和系统。所述方法的一具体实施方式包括:监测等待队列中是否存在业务请求,其中等待队列用于存储待执行的业务请求;响应于确定等待队列中存在业务请求,交换运行队列和等待队列,其中运行队列用于存储当前执行的业务请求;将交换后的运行队列中的业务请求合并后生成待处理请求集合并发送至业务处理接口,以通过业务处理接口对待处理请求集合进行批量处理;在待处理请求集合中的业务请求处理完毕后,清空交换后的运行队列。该实施方式能够根据业务需求和硬件处理能力自适应调整批处理数量,提升了业务处理效率。

    处理器以及用于在处理器上执行指令的方法

    公开(公告)号:CN107766079B

    公开(公告)日:2022-03-11

    申请号:CN201610693068.1

    申请日:2016-08-19

    发明人: 欧阳剑 漆维 王勇

    摘要: 本申请公开了处理器和用于在处理器上执行指令的方法。所述方法的一具体实施方式包括:取出待执行的指令,所述指令包括源地址字段、目的地址字段、操作类型字段、操作参数字段;根据所述操作类型字段在至少一个执行单元中确定待生成的控制信号所控制的执行单元,根据所述源地址字段和所述目的地址字段分别确定待生成的控制信号控制执行单元所操作数据的源地址和目的地址,根据所述操作参数字段确定待生成的控制信号控制执行单元所操作数据的数据量;根据所确定的执行单元、源地址、目的地址、数据量生成控制信号;使用所述控制信号控制所述至少一个执行单元中的执行单元执行操作。该实施方式提高了指令译码和执行的效率。

    用于存储管理的方法、装置、设备和计算机可读存储介质

    公开(公告)号:CN112395216A

    公开(公告)日:2021-02-23

    申请号:CN201910702452.7

    申请日:2019-07-31

    IPC分类号: G06F12/06 G06F12/10 G06F13/16

    摘要: 根据本公开的示例实施例,提供了一种用于存储管理的方法、装置、设备和计算机可读存储介质。一种用于存储管理的方法,包括:获取针对数据处理系统的存储器的多个通道的可用通道模式,可用通道模式指示多个通道的可用性,多个通道中的每个通道与存储器中的一组地址相关联;获取通道数据颗粒度,通道数据颗粒度指示每个通道可承载的数据块的大小;获取待传输数据在存储器上的目标地址;以及基于可用通道模式和通道数据颗粒度,确定与目标地址相对应的转换地址。由此,本方案可以通过将目标地址动态映射为转换地址,提高数据处理系统的良率、使用寿命、灵活性和适应性。

    数据处理装置、人工智能芯片及电子设备

    公开(公告)号:CN110825312A

    公开(公告)日:2020-02-21

    申请号:CN201810909301.4

    申请日:2018-08-10

    IPC分类号: G06F3/06

    摘要: 本申请实施例公开了数据处理装置、人工智能芯片及电子设备。数据处理装置的一具体实施方式包括:输入存储器,存储待处理数据;数据搬运部件,读取并解析外部处理指令以获取读数据地址、写数据地址以及操作命令,根据读数据地址读取待处理数据,根据操作命令对待处理数据进行处理,得到处理后的输出数据及写数据地址,并发出写数据请求;多路仲裁部件,响应于接收到至少一个数据搬运部件的写数据请求,从接收到的输出数据和写数据地址中选通其中一个数据搬运部件的输出数据及对应的写数据地址输出,并发送写使能信号;输出存储器,响应于接收到写使能信号,将从多路仲裁部件接收到的输出数据写入对应的写数据地址。该实施方式提升了数据处理效率。

    处理器以及用于在处理器上执行指令的方法

    公开(公告)号:CN107678781A

    公开(公告)日:2018-02-09

    申请号:CN201610621990.X

    申请日:2016-08-01

    发明人: 漆维 欧阳剑 王勇

    IPC分类号: G06F9/38 G06F9/30 G06F9/50

    摘要: 本申请公开了处理器以及用于在处理器上执行指令的方法。所述处理器的一具体实施方式包括:主机交互器件、指令控制器件、片外存储器、片上缓存、阵列处理机,其中:所述主机交互器件,用于与所述处理器所连接的主机交互数据与指令,其中,所交互的数据以矩阵为粒度;所述片外存储器,用于存储从所述主机接收的、待执行矩阵运算的矩阵;所述指令控制器件,用于将从所述主机接收的外部指令转换成一系列访存指令与一系列计算指令并执行所转换成的指令。该实施方式能提高对深度学习算法的执行效率。