一种基于Winograd算法的3D CNN加速方法及系统

    公开(公告)号:CN107993186A

    公开(公告)日:2018-05-04

    申请号:CN201711342538.0

    申请日:2017-12-14

    Abstract: 本发明公开了一种基于Winograd算法的3D CNN加速方法及系统,其方法实施步骤包括:从输入特征图中读取待变换的特征图子块,从权值缓存中读取卷积核子块,对特征图子块Bin以及卷积核子块执行3D Winograd算法输出结果并累加输出累加结果,判断是否输入特征图中的所有输入特征图都读取完毕,如果读取完毕,则将累加结果写回输出特征图缓存Out。本发明通过对Winograd算法进行了扩展并将其用于3D CNN计算中,运用了2D Winograd算法进行CNN加速并取得了良好的效果,能够有效降低CNN算法的计算复杂度、提升基于FPGA的3D CNN加速器的计算性能以及能效比。

    基于双层结构的数据流频次估计方法、系统及介质

    公开(公告)号:CN111782700B

    公开(公告)日:2023-08-18

    申请号:CN202010777760.9

    申请日:2020-08-05

    Abstract: 本发明公开了一种基于双层结构的数据流频次估计方法、系统及介质,本发明方法包括通过第一层计数器结构、第二层计数器结构构成的双层结构来对收到的数据流计数,且其中第二层计数器结构用于记录第一层计数器结构中溢出的数据流;当需要查询数据流的频次估计值时,根据第一层计数器结构、第二层计数器结构中记录的数据流标识统计查询数据流的频次估计值。本发明可实现将大小流分开进行处理,针对性的对大小流进行特定的结构存储和计数,从而能够减少存储需求,提高大小流的评估精度。

    一种基于强化学习的深度学习任务调度方法

    公开(公告)号:CN111258734B

    公开(公告)日:2022-09-23

    申请号:CN202010047640.3

    申请日:2020-01-16

    Abstract: 本发明涉及一种基于强化学习的深度学习任务调度方法。目的在于面向深度学习多任务调度场景,基于任务在线性能反馈,自适应学习并调整调度策略,尽可能提高任务完成效率和集群资源的利用效率。本方法基于深度学习任务在不同调度策略下的性能在线反馈进行自适应学习,并自适应更新调度决策,从而最大化任务执行效率和集群资源利用率。本发明的设计与实现均属于轻量级,不需要修改用户的编程方式和任务提交方式,同时对于运维人员友好,部署方便简洁。

    一种支持用户QoS感知的深度学习任务调度方法

    公开(公告)号:CN111258735A

    公开(公告)日:2020-06-09

    申请号:CN202010047652.6

    申请日:2020-01-16

    Abstract: 本发明涉及一种支持用户QoS感知的深度学习任务调度方法。解决QoS资源配置之间冲突问题,提高资源利用率问题。本方法包括离线任务分析评估和在线实时任务调度两个部分。离线任务评估是对用户提交的深度学习模型进行评估和分析,通过分析任务的性能,并构建离线的性能预测模型。在线实时任务调度,基于性能预测模型,决定任务的执行顺序和放置策略,完成调度和执行的过程。本方法可以对深度学习任务进行轻量级的离线评估,在保证用户QoS的前提下,最大化提高数据中心集群的资源利用效率。

    面向SIMD和VLIW架构的代码优化生成方法及系统

    公开(公告)号:CN116450138A

    公开(公告)日:2023-07-18

    申请号:CN202310223369.8

    申请日:2023-03-09

    Abstract: 本发明公开了一种面向SIMD和VLIW架构的代码优化生成方法及系统,本发明方法包括:S1,对输入的原始循环程序进行分块得到向量DSL程序;S2,对向量DSL程序进行向量化得到内联汇编程序;S3,对内联汇编程序进行指令级别的代码优化得到汇编代码。本发明能够自动为各种规模的内核程序生成在SIMD+VLIW架构上高效运行的内核代码,并且能够充分高效地利用SIMD+VLIW架构的特点进行优化,减少轻开发人员的负担,大大提高内核代码的执行效率,实现可编程性和性能的平衡。

    一种基于SketchLearn的混合网络测量方法、装置及介质

    公开(公告)号:CN111835599B

    公开(公告)日:2022-03-22

    申请号:CN202010777783.X

    申请日:2020-08-05

    Abstract: 本发明公开了一种基于SketchLearn的混合网络测量方法、装置及介质,本发明方法包括:接收数据包,通过包含m个阶段、每一个阶段包含n个计数块的Hashpipe结构来进行n个阶段的计数,且在完成n个阶段计数后流出;将Hashpipe结构流出的数据包通过sketch结构采用SketchLearn算法逻辑进行计数;根据Hashpipe结构以及sketch结构中的计数值获得测量结果。本发明有效的缓解了大流占总流量比重过大而导致的需要SketchLearn结构内存过大的弊端,在保持和提高网络测量精度的同时节省了大量内存,能够提高由减少数据平面的内存而带来的统计学上样本减少导致的误差增大的问题。

    一种基于Winograd算法的3D CNN加速方法及系统

    公开(公告)号:CN107993186B

    公开(公告)日:2021-05-25

    申请号:CN201711342538.0

    申请日:2017-12-14

    Abstract: 本发明公开了一种基于Winograd算法的3D CNN加速方法及系统,其方法实施步骤包括:从输入特征图中读取待变换的特征图子块,从权值缓存中读取卷积核子块,对特征图子块Bin以及卷积核子块执行3D Winograd算法输出结果并累加输出累加结果,判断是否输入特征图中的所有输入特征图都读取完毕,如果读取完毕,则将累加结果写回输出特征图缓存Out。本发明通过对Winograd算法进行了扩展并将其用于3D CNN计算中,运用了2D Winograd算法进行CNN加速并取得了良好的效果,能够有效降低CNN算法的计算复杂度、提升基于FPGA的3D CNN加速器的计算性能以及能效比。

    基于双层结构的数据流频次估计方法、系统及介质

    公开(公告)号:CN111782700A

    公开(公告)日:2020-10-16

    申请号:CN202010777760.9

    申请日:2020-08-05

    Abstract: 本发明公开了一种基于双层结构的数据流频次估计方法、系统及介质,本发明方法包括通过第一层计数器结构、第二层计数器结构构成的双层结构来对收到的数据流计数,且其中第二层计数器结构用于记录第一层计数器结构中溢出的数据流;当需要查询数据流的频次估计值时,根据第一层计数器结构、第二层计数器结构中记录的数据流标识统计查询数据流的频次估计值。本发明可实现将大小流分开进行处理,针对性的对大小流进行特定的结构存储和计数,从而能够减少存储需求,提高大小流的评估精度。

Patent Agency Ranking