一种神经网络的剪枝方法
    3.
    发明公开

    公开(公告)号:CN115374935A

    公开(公告)日:2022-11-22

    申请号:CN202211122342.1

    申请日:2022-09-15

    IPC分类号: G06N3/08 G06N3/063

    摘要: 本发明提出了一种神经网络的剪枝方法,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。本发明能够在满足脉动阵列SA工作模式,保证其工作效率的前提下,减少了模型的参数量,提高了模型推理的速度。

    一种神经网络的剪枝方法

    公开(公告)号:CN115374935B

    公开(公告)日:2023-08-11

    申请号:CN202211122342.1

    申请日:2022-09-15

    IPC分类号: G06N3/082 G06N3/063

    摘要: 本发明提出了一种神经网络的剪枝方法,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。本发明能够在满足脉动阵列SA工作模式,保证其工作效率的前提下,减少了模型的参数量,提高了模型推理的速度。

    一种面向多中心场景的医疗数据融合采集方法及系统

    公开(公告)号:CN116936017B

    公开(公告)日:2024-05-24

    申请号:CN202310937662.0

    申请日:2023-07-28

    IPC分类号: G16H10/60 G16H50/70 G16H50/20

    摘要: 本发明公开了医疗数据融合采集技术领域的一种面向医疗场景多中心场景的医疗数据融合采集方法及系统,该系统包括数据用户层、数据接入层和数据汇聚层,通过数据用户层对所属医疗机构内的录入的医疗数据进行抓取并生成通信日志和存储日志,基于医疗数据的类型通过数据接入层与数据汇聚层建立专属的数据通信链路,数据汇聚层对医疗数据内容进行检索后,通过专属的通信链路获取所需医疗数据,并对医疗数据进行校验,将正确的医疗数据通过中心数据库进行存储,并对医疗数据进行备份处理,存储也分为便于快速检索的分布式关系型存储,也存储在分布式文件数据库中。本发明,提高了所采集的医疗数据多样性以及准确性,并避免了医疗数据重复采集的情况。

    一种面向多中心场景的医疗数据融合采集方法及系统

    公开(公告)号:CN116936017A

    公开(公告)日:2023-10-24

    申请号:CN202310937662.0

    申请日:2023-07-28

    IPC分类号: G16H10/60 G16H50/70 G16H50/20

    摘要: 本发明公开了医疗数据融合采集技术领域的一种面向医疗场景多中心场景的医疗数据融合采集方法及系统,该系统包括数据用户层、数据接入层和数据汇聚层,通过数据用户层对所属医疗机构内的录入的医疗数据进行抓取并生成通信日志和存储日志,基于医疗数据的类型通过数据接入层与数据汇聚层建立专属的数据通信链路,数据汇聚层对医疗数据内容进行检索后,通过专属的通信链路获取所需医疗数据,并对医疗数据进行校验,将正确的医疗数据通过中心数据库进行存储,并对医疗数据进行备份处理,存储也分为便于快速检索的分布式关系型存储,也存储在分布式文件数据库中。本发明,提高了所采集的医疗数据多样性以及准确性,并避免了医疗数据重复采集的情况。

    一种手术流程图像采集控制系统及方法

    公开(公告)号:CN110559089A

    公开(公告)日:2019-12-13

    申请号:CN201910893991.3

    申请日:2019-09-20

    IPC分类号: A61B90/00

    摘要: 本发明涉及一种手术流程图像采集控制系统及方法,属于信息化领域。该系统包括:图像采集模块、图像分析模块、决策控制模块和图像展示与存储模块组成;该图像采集与控制方法通过安装于手术环境中手术照明系统上的图像采集模块对手术过程中、手术照明系统照射区域内的图像信息进行实时采集,并通过图像分析模块的对视频图像信息进行特征提取,并以此为依据进行决策控制,最终实现最优手术流程图像数据的实时回传与存储备份。本发明可以实现医生在手术环境下对图像进行智能采集,减少了医生的直接操作,提高视频采集质量,提升用户体验。

    专用于CNN加速器的深度学习编译器优化方法

    公开(公告)号:CN114995822B

    公开(公告)日:2024-08-23

    申请号:CN202210638258.9

    申请日:2022-06-07

    申请人: 重庆大学

    IPC分类号: G06F8/41 G06N3/0464 G06N3/082

    摘要: 本发明提出了一种专用于CNN加速器的深度学习编译器优化方法,包括以下步骤:S1,通过算子融合和/或bn融合的优化方法减少加速器对内存的访问以及存储空间的浪费,同时使用内存分配地址叠加的方式避免各张量之间的数据覆盖;S2,采用固定硬件下的多种模型量化部署方案,通过融合非对称量化的偏移和卷积偏置;同时通过编译器与加速器的协同优化,将DSP的输入数据配置为两个数的移位相加从而在一个DSP中同时进行两次乘法运算,最终实现编译器对可变位宽量化的支持。

    一种面向CNN专用加速器的深度学习编译器优化方法

    公开(公告)号:CN114995823B

    公开(公告)日:2024-08-20

    申请号:CN202210639397.3

    申请日:2022-06-07

    申请人: 重庆大学

    IPC分类号: G06F8/41 G06N3/0464 G06N3/082

    摘要: 本发明提出了一种面向CNN专用加速器的深度学习编译器优化方法,包括以下之一或者任意组合步骤:S1,通过算子融合和/或bn融合的优化方法减少加速器对内存的访问以及存储空间的浪费,同时使用内存分配地址叠加的方式避免各张量之间的数据覆盖;S2,采用内存共享和编址的方法,并通过特征图深度复制、算子执行顺序交换策略使编译器支持复杂的跳跃连接网络结构;S3,采用优化卷积循环平铺和循环重排的调度策略来提升加速器的性能。