-
公开(公告)号:CN112000370B
公开(公告)日:2022-04-15
申请号:CN202010878243.0
申请日:2020-08-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F9/30
摘要: 本申请公开了循环指令的处理方法、装置、设备和存储介质,涉及语音、芯片领域。具体实现方案为:获取计算机程序,计算机程序包括第一循环体,第一循环体根据待编译软件代码中的第二循环体生成,第一循环体包括多条第一循环指令,多条第一循环指令能够被计算机设备的硬件结构识别;在检测到第一循环体的情况下,根据多条第一循环指令,确定第一循环体的循环参数;根据第一循环体的循环参数,获取多条第一循环指令;执行多条第一循环指令。本申请实施例中第一循环体根据待编译软件代码中的第二循环体生成,且第一循环体包括的第一循环指令能够被计算机设备的硬件结构识别,因此硬件结构可以直接根据第一循环指令准确地确定循环参数。
-
公开(公告)号:CN113554149B
公开(公告)日:2022-04-12
申请号:CN202110679297.9
申请日:2021-06-18
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种神经网络处理单元NPU、神经网络的处理方法及其装置,涉及人工智能技术领域中的深度学习、语音技术等领域。该方案为:通过量化单元获取浮点型的输入数据,并将浮点型的输入数据转换成定点型的输入数据,对定点型的输入数据提供至运算单元,以及获取神经网络的网络参数并提供至运算单元,并通过运算单元基于网络参数对量化后的输入数据进行矩阵向量操作和/或卷积操作,以得到量化后的输入向量的运算结果,从而通过同时支持浮点型和定点型表示方式并进行适应性的结合方式,在确保精度要求的同时,降低了功耗,提升了NPU的算力。
-
公开(公告)号:CN112580787A
公开(公告)日:2021-03-30
申请号:CN202011566189.2
申请日:2020-12-25
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了神经网络加速器的数据处理方法、装置、电子设备及存储介质,涉及大数据和深度学习等人工智能技术领域。具体实现方案为:获取待处理数据以及对应的待执行操作;获取与待执行操作对应的实数全连接操作;根据神经网络加速器的实数全连接单元,对待处理数据执行实数全连接操作,以得到待执行操作针对待处理数据的执行结果。由此通过神经网络加速器的实数全连接单元,可以实现对待处理数据的任何操作,从而实现了实数全连接单元的复用,在硬件逻辑最少的情况下,实现了多种操作。
-
公开(公告)号:CN113570034B
公开(公告)日:2022-09-27
申请号:CN202110679305.X
申请日:2021-06-18
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种处理装置、神经网络的处理方法及其装置,涉及深度学习、语音技术等领域。具体实现方案为:处理装置包括通过总线连接的神经网络处理单元NPU、伪静态随机存储器PSRAM和数字信号处理器DSP,其中,DSP在内部的存储器中存储待处理的输入数据及存储NPU对输入数据的运算结果;PSRAM存储神经网络的网络参数;NPU通过总线访问DSP内部的存储器,以读取得到待处理的输入数据,及通过总线访问PSRAM得到至少部分网络参数,根据读取到的至少部分网络参数对输入数据执行矩阵向量操作和卷积操作中的至少一个,并同步继续读取PSRAM中的其余网络参数。由此,可以实现数据读取/加载和计算的并行,从而可以提升计算效率。
-
公开(公告)号:CN113570033A
公开(公告)日:2021-10-29
申请号:CN202110679295.X
申请日:2021-06-18
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种神经网络的处理方法、神经网络处理单元、神经网络的处理方法及其装置,涉及深度学习、语音技术等领域。具体实现方案为:通过神经网络处理单元NPU中的量化单元获取浮点型的输入数据,对浮点型的输入数据进行量化得到量化后的输入数据,并将量化后的输入数据提供至运算单元,从而由NPU中的运算单元对量化后的输入数据执行矩阵向量操作和/或卷积操作,以得到输入数据的运算结果,之后,由量化单元对运算单元输出的运算结果进行反量化,得到反量化结果。由此,通过采用专门的NPU,来实现矩阵计算和/或卷积计算,当该NPU应用于语音芯片中时,可以降低语音芯片中核心的处理负担,提升语音芯片中核心的处理效率。
-
公开(公告)号:CN112259071A
公开(公告)日:2021-01-22
申请号:CN202011001663.7
申请日:2020-09-22
申请人: 北京百度网讯科技有限公司
IPC分类号: G10L13/02 , G10L15/16 , G10L15/22 , G10L15/26 , G10L15/28 , G10L17/18 , G10L17/22 , G10L25/30
摘要: 本申请公开了一种语音处理系统、语音处理方法、电子设备和可读存储介质,涉及语音处理技术领域。语音处理系统包括:神经网络处理器NPU与RISC‑V处理器;RISC‑V处理器包含预先定义的NPU指令,RISC‑V处理器用于向NPU发送NPU指令,以使得NPU执行相应的神经网络计算;NPU包含内存单元与计算单元,内存单元中包含多个存储分组;计算单元用于根据接收到的NPU指令,执行主体计算、特殊计算、辅助计算与复杂指令集CISC控制中的一种。语音处理方法包括:获取待处理语音数据;将待处理语音数据作为语音处理系统的输入数据,由语音处理系统对输入数据进行神经网络计算得到输出结果;将输出结果作为待处理语音数据的语音处理结果。本申请能够提升语音处理系统的离线处理效率。
-
公开(公告)号:CN112580787B
公开(公告)日:2023-11-17
申请号:CN202011566189.2
申请日:2020-12-25
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N3/0464 , G06N3/06
摘要: 本申请公开了神经网络加速器的数据处理方法、装置、电子设备及存储介质,涉及大数据和深度学习等人工智能技术领域。具体实现方案为:获取待处理数据以及对应的待执行操作;获取与待执行操作对应的实数全连接操作;根据神经网络加速器的实数全连接单元,对待处理数据执行实数全连接操作,以得到待执行操作针对待处理数据的执行结果。由此通过神经网络加速器的实数全连接单元,可以实现对待处理数据的任何操作,从而实现了实数全连接单元的复用,在硬件逻辑最少的情况下,实现了多种操作。
-
公开(公告)号:CN111930427B
公开(公告)日:2022-06-21
申请号:CN202010827436.3
申请日:2020-08-17
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了指令发射方法、装置、电子设备以及存储介质,涉及处理器(数字芯片)、数据处理、语音处理技术领域。具体实现方案为:译码单元获取发射周期内两个发射通道的发射状态;所述译码单元根据所述两个发射通道的发射状态组合,生成针对所述两个发射通道的发射控制信号;所述译码单元控制所述两个发射通道按照所述发射控制信号向执行单元发射指令。本申请的发射方法,能够根据两个发射通道的发射状态组合确定针对两个发射通道的发射控制信号,且可控制两个发射通道按照发射控制信号发射指令,可实现乱序发射,相较于一些乱序发射架构采用在硬件中设置保留站的方式,该方法具有硬件结构简单、处理器占用面积和功耗小、开发成本低等优点。
-
公开(公告)号:CN112559040B
公开(公告)日:2021-12-28
申请号:CN202011401623.1
申请日:2020-12-02
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F9/30
摘要: 本申请公开了指令执行方法、装置、电子设备和存储介质,涉及语音、自然语言处理、深度学习技术领域。具体实现方案为:指令分类器识别当前输入指令的类别;类别为参数配置指令,则指令分类器根据参数配置指令将对应的参数写入指令缓存中的对应的第一参数寄存器中;类别为计算指令,则指令分类器将计算指令写入指令缓存中的指令寄存器中;运算单元检测到指令寄存器不为空,则从指令寄存器中取出下一条计算指令,并根据取出的计算指令从对应的第一参数寄存器中取出写入的参数,将取出的参数更新至运算单元内的第二参数寄存器中进行计算。本申请的指令执行方法、装置、电子设备和存储介质,提高了运算执行效率。
-
公开(公告)号:CN112559040A
公开(公告)日:2021-03-26
申请号:CN202011401623.1
申请日:2020-12-02
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F9/30
摘要: 本申请公开了指令执行方法、装置、电子设备和存储介质,涉及语音、自然语言处理、深度学习技术领域。具体实现方案为:指令分类器识别当前输入指令的类别;类别为参数配置指令,则指令分类器根据参数配置指令将对应的参数写入指令缓存中的对应的第一参数寄存器中;类别为计算指令,则指令分类器将计算指令写入指令缓存中的指令寄存器中;运算单元检测到指令寄存器不为空,则从指令寄存器中取出下一条计算指令,并根据取出的计算指令从对应的第一参数寄存器中取出写入的参数,将取出的参数更新至运算单元内的第二参数寄存器中进行计算。本申请的指令执行方法、装置、电子设备和存储介质,提高了运算执行效率。
-
-
-
-
-
-
-
-
-