基于集成DPU多核异构的神经网络计算加速方法及装置
摘要:
本发明公开了基于集成DPU多核异构的神经网络计算加速方法及装置,包括:检测待计算神经网络的卷积核候选冗余数据,所述候选冗余数据包括网络拓扑结构和卷积核参数;根据候选冗余数据对神经网络进行优化缩减并进行重新训练,获取优化网络;基于优化网络进行待处理数据的计算;所述重新训练过程以及待处理数据的计算过程采用基于DPU多核异构处理器系统进行。本发明对于神经网络计算加速,从网络模型本身和网络模型计算架构两方面结合,通过软件优化设计与硬件加速运算的协同作用,实现神经网络的推理过程加速。
0/0