-
-
公开(公告)号:CN111260051B
公开(公告)日:2024-05-14
申请号:CN202010085465.7
申请日:2020-02-01
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N3/063
摘要: 本申请实施例公开了一种神经网络运算方法及相关装置,包括:多个神经网络运算核,其中,多个神经网络运算核中的每个包括:神经元选数模块,用于接收多个输入神经元,获取多个输入神经元的输入神经元索引序列和权值索引序列,依据所述输入神经元索引序列和所述权值索引序列确定目标输入神经元和目标权值索引;神经网络功能模块,用于接收目标输入神经元和目标权值索引;并依据所述目标权值索确定目标权值,依据所述目标权值对所述目标输入神经元进行计算,得到输出神经元;神经元过滤器,用于接收所述神经网络功能模块的所述输出神经元,对所述输出神经元进行过滤,得到过滤后的输出神经元。实施本申请实施例具有提高神经网络计算速率的优点。
-
公开(公告)号:CN112396186B
公开(公告)日:2024-05-03
申请号:CN201910740813.7
申请日:2019-08-12
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N20/00
摘要: 本公开涉及一种执行方法、装置及相关产品。机器学习装置包括一个或多个指令处理装置,用于从其他处理装置中获取待执行数据和控制信息,并执行指定的机器学习执行,将执行结果通过I/O接口传递给其他处理装置;当机器学习执行装置包含多个指令处理装置时,多个指令处理装置间可以通过特定的结构进行连接并传输数据。其中,多个指令处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据;多个指令处理装置共享同一控制系统或拥有各自的控制系统、且共享内存或者拥有各自的内存;多个指令处理装置的互联方式是任意互联拓扑。本公开实施例所提供的执行方法、装置及相关产品的适用范围广,对收集指令的处理效率高、处理速度快。
-
公开(公告)号:CN117933314A
公开(公告)日:2024-04-26
申请号:CN202410020777.8
申请日:2017-04-21
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N3/0464 , G06N3/063 , G06F17/16
摘要: 本公开涉及一种处理装置,包括:存储部分,用于存储数据,所述数据包括神经网络的待运算数据;运算部分,用于对待运算数据进行运算,包括采用加法器和/或多类型乘法器对待运算数据进行加速计算;控制部分,用于控制存储部分和运算部分,包括根据待运算数据进行加速运算。本公开所述的装置具有灵活性强、可配置程度高、运算速度快、功耗低等优点。
-
公开(公告)号:CN113469327B
公开(公告)日:2024-04-05
申请号:CN202110703451.1
申请日:2021-06-24
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N3/0464 , G06N3/063 , G06N3/08 , G06F15/78
摘要: 本发明涉及执行转数提前的集成电路装置,其中本发明的计算装置包括在集成电路装置中,该集成电路装置包括通用互联接口和其他处理装置。计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。集成电路装置还可以包括存储装置,存储装置分别与计算装置和其他处理装置连接,用于计算装置和其他处理装置的数据存储。
-
公开(公告)号:CN113537481B
公开(公告)日:2024-04-02
申请号:CN202110713121.0
申请日:2016-12-30
申请人: 上海寒武纪信息科技有限公司
摘要: 一种用于执行LSTM神经网络运算的装置和运算方法。该装置包括直接内存访问单元、指令缓存单元、控制器单元、并列设置的多个数据缓存单元和并列设置的多个数据处理模块,其中所述多个数据处理模块与所述数据缓存单元一一对应,用于从相应数据缓存单元中获取输入数据和运算时所需的权值和偏置,进行LSTM神经网络运算;所述多个数据处理模块之间执行并行运算。本发明采用专用指令运行,运算所需指令数大幅减少,译码开销降低;将权值和偏置缓存,使得数据传输开销降低;本发明不限制具体应用领域,可在诸如语音识别、文本翻译、音乐合成等领域使用,可扩展性强;多个数据处理模块并行运行,显著提高LSTM网络的运算速度。
-
公开(公告)号:CN113537480B
公开(公告)日:2024-04-02
申请号:CN202110708810.2
申请日:2016-12-30
申请人: 上海寒武纪信息科技有限公司
摘要: 一种用于执行LSTM神经网络运算的装置和运算方法。该装置包括直接内存访问单元、指令缓存单元、控制器单元、并列设置的多个数据缓存单元和并列设置的多个数据处理模块,其中所述多个数据处理模块与所述数据缓存单元一一对应,用于从相应数据缓存单元中获取输入数据和运算时所需的权值和偏置,进行LSTM神经网络运算;所述多个数据处理模块之间执行并行运算。本发明采用专用指令运行,运算所需指令数大幅减少,译码开销降低;将权值和偏置缓存,使得数据传输开销降低;本发明不限制具体应用领域,可在诸如语音识别、文本翻译、音乐合成等领域使用,可扩展性强;多个数据处理模块并行运行,显著提高LSTM网络的运算速度。
-
公开(公告)号:CN112085185B
公开(公告)日:2024-04-02
申请号:CN201910888150.3
申请日:2019-09-19
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N3/0495 , G06N3/045 , G06N3/048 , G06N3/063 , G06N3/084
摘要: 本披露涉及一种神经网络的量化参数调整方法、装置及相关产品,上述方法可以根据所述待量化数据的数据变动幅度,确定目标迭代间隔,以根据所述目标迭代间隔动态调整所述神经网络运算中的量化参数。本披露的神经网络的量化参数调整方法、装置及相关产品,能够提高神经网络量化过程中的精度,提高量化效率和运算效率。
-
公开(公告)号:CN112085192B
公开(公告)日:2024-03-29
申请号:CN201910960314.9
申请日:2019-09-19
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N3/0495 , G06N3/045 , G06N3/048 , G06N3/063 , G06N3/084
摘要: 本技术方案涉及一种神经网络的量化参数确定方法及相关产品,相关产品中的板卡包括:存储器件、接口装置和控制器件以及人工智能芯片;其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;所述存储器件,用于存储数据;所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;所述控制器件,用于对所述人工智能芯片的状态进行监控。所述板卡可以用于执行人工智能运算。
-
公开(公告)号:CN111523653B
公开(公告)日:2024-03-29
申请号:CN201910109490.1
申请日:2019-02-03
申请人: 上海寒武纪信息科技有限公司
IPC分类号: G06N3/063 , G06N3/0464
摘要: 本公开提供一种运算装置和方法,所述装置用于计算获得电压频率控制信息,并根据电压频率控制信息调整运算装置的工作电压或工作频率。本申请实施例通过调整神经网络处理器的工作频率和工作电压,有效降低神经网络处理器的功耗并提升其稳定性,延长神经网络处理器的使用寿命。
-
-
-
-
-
-
-
-
-