一种用于人工智能的加速方法和装置
摘要:
本发明公开了一种加速方法,包括:确定卷积计算的模板尺寸、图像尺寸和模板个数M;基于图像尺寸、模板尺寸、模板个数和/或加速装置的计算能力确定加速链中卷积单元的个数N和数据循环的最短长度;将模板系数加载到加速链中的卷积单元;在FIFO缓存中加载多行图像数据;启动数据流,图像数据从FIFO缓存进入第一卷积单元的图像数据输入端口,每次向第一卷积单元的图像数据输入端口提供一列数据,后一列图像数据将前一列图像数据向前推动一位,边流动边计算;将每次计算的结果存储在结果存储器的指定存储位置。
公开/授权文献
0/0