-
公开(公告)号:CN117035021A
公开(公告)日:2023-11-10
申请号:CN202311003788.7
申请日:2023-08-10
Applicant: 北京邮电大学
IPC: G06N3/0464 , G06N3/08 , G06F8/40
Abstract: 本发明公开了一种在FPGA上部署卷积神经网络的方法,涉及CNN硬件部署技术领域,该方法包括:在对卷积神经网络进行Python到C++代码的转换过程中:若卷积神经网络中存在特定网络结构,则对每个特定网络结构,将特定网络结构内两个层合并到一个共享的内层循环中;特定网络结构为两个层具有共享的外部循环,两个层之间只有中间结果的数据存在数据依赖关系;若卷积神经网络中卷积层的数量小于或者等于设定值,则采用循环展开的方式循环并行计算,否则则采用循环流水的方式循环并行计算;对于卷积神经网络中参与计算的数组,对数组进行切片得到多个缓冲区;缓冲区分为行缓冲和窗口缓冲。本发明实现了CNN快速低功耗推理工作。
-
公开(公告)号:CN116629353B
公开(公告)日:2023-11-07
申请号:CN202310903805.6
申请日:2023-07-24
Applicant: 北京邮电大学
IPC: G06N3/10 , G06F30/331 , G06F30/327 , G06F8/41 , G06F117/08
Abstract: 本发明公开了一种面向FPGA的粗粒度FIFO硬件通道自动拟合方法,涉及FPGA技术领域,该方法包括:获取数据流目标区域内的子函数调用及对应的调用指令序列;判断任一相邻子函数调用指令是否具有相同的数组参数变量,若是将相邻子函数调用指令所对应的函数体内部的所有子函数调用实现函数内嵌,并扫描实现函数内嵌的相邻子函数内每条与数组参数变量相关的读/写指令,若相邻子函数中的前一个子函数内只有写指令发生在数组参数变量上且相邻子函数中的后一个子函数内只有读指令发生在数组参数变量上,则完成FIFO硬件通道的拟合。本发明能够帮助用户自动分析函数间的数据传输关系,自动判定并完成FIFO硬件通道的拟合。
-
公开(公告)号:CN116629353A
公开(公告)日:2023-08-22
申请号:CN202310903805.6
申请日:2023-07-24
Applicant: 北京邮电大学
IPC: G06N3/10 , G06F30/331 , G06F30/327 , G06F8/41 , G06F117/08
Abstract: 本发明公开了一种面向FPGA的粗粒度FIFO硬件通道自动拟合方法,涉及FPGA技术领域,该方法包括:获取数据流目标区域内的子函数调用及对应的调用指令序列;判断任一相邻子函数调用指令是否具有相同的数组参数变量,若是将相邻子函数调用指令所对应的函数体内部的所有子函数调用实现函数内嵌,并扫描实现函数内嵌的相邻子函数内每条与数组参数变量相关的读/写指令,若相邻子函数中的前一个子函数内只有写指令发生在数组参数变量上且相邻子函数中的后一个子函数内只有读指令发生在数组参数变量上,则完成FIFO硬件通道的拟合。本发明能够帮助用户自动分析函数间的数据传输关系,自动判定并完成FIFO硬件通道的拟合。
-
-