- 专利标题: 神经网络处理单元NPU、神经网络的处理方法及其装置
-
申请号: CN202110679297.9申请日: 2021-06-18
-
公开(公告)号: CN113554149B公开(公告)日: 2022-04-12
- 发明人: 田超 , 贾磊 , 闻军会 , 邓广来 , 李强
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 王萌
- 主分类号: G06F17/16
- IPC分类号: G06F17/16 ; G06N3/04 ; G06N3/063
摘要:
本公开提供了一种神经网络处理单元NPU、神经网络的处理方法及其装置,涉及人工智能技术领域中的深度学习、语音技术等领域。该方案为:通过量化单元获取浮点型的输入数据,并将浮点型的输入数据转换成定点型的输入数据,对定点型的输入数据提供至运算单元,以及获取神经网络的网络参数并提供至运算单元,并通过运算单元基于网络参数对量化后的输入数据进行矩阵向量操作和/或卷积操作,以得到量化后的输入向量的运算结果,从而通过同时支持浮点型和定点型表示方式并进行适应性的结合方式,在确保精度要求的同时,降低了功耗,提升了NPU的算力。
公开/授权文献
- CN113554149A 神经网络处理单元NPU、神经网络的处理方法及其装置 公开/授权日:2021-10-26