图像处理方法、装置、存储介质及设备
摘要:
本发明公开了一种图像处理方法、装置、存储介质及设备,属于深度学习领域。方法包括:对于预设卷积神经网络的每一个卷积层,获取输入卷积层的特征图;对特征图进行第一预处理,根据预处理后的特征图生成第一矩阵,预处理后的特征图中连续使用的特征数据被排布第一矩阵中的相邻位置;对卷积层的至少一个卷积核的权重进行第二预处理,根据预处理后的权重生成第二矩阵,预处理后的权重中连续使用到的权重被排布于第二矩阵的相邻位置;对第一矩阵和第二矩阵中的每行元素执行外积操作,在对得到的外积运算结果进行第三预处理后,得到卷积层输出的卷积运算结果。在实现winograd卷积加速运算时,有效提升了计算密度以及内存访问效率,降低了硬件实现的复杂度。
公开/授权文献
0/0