专用于CNN加速器的深度学习编译器优化方法

    公开(公告)号:CN114995822B

    公开(公告)日:2024-08-23

    申请号:CN202210638258.9

    申请日:2022-06-07

    申请人: 重庆大学

    IPC分类号: G06F8/41 G06N3/0464 G06N3/082

    摘要: 本发明提出了一种专用于CNN加速器的深度学习编译器优化方法,包括以下步骤:S1,通过算子融合和/或bn融合的优化方法减少加速器对内存的访问以及存储空间的浪费,同时使用内存分配地址叠加的方式避免各张量之间的数据覆盖;S2,采用固定硬件下的多种模型量化部署方案,通过融合非对称量化的偏移和卷积偏置;同时通过编译器与加速器的协同优化,将DSP的输入数据配置为两个数的移位相加从而在一个DSP中同时进行两次乘法运算,最终实现编译器对可变位宽量化的支持。

    一种面向CNN专用加速器的深度学习编译器优化方法

    公开(公告)号:CN114995823B

    公开(公告)日:2024-08-20

    申请号:CN202210639397.3

    申请日:2022-06-07

    申请人: 重庆大学

    IPC分类号: G06F8/41 G06N3/0464 G06N3/082

    摘要: 本发明提出了一种面向CNN专用加速器的深度学习编译器优化方法,包括以下之一或者任意组合步骤:S1,通过算子融合和/或bn融合的优化方法减少加速器对内存的访问以及存储空间的浪费,同时使用内存分配地址叠加的方式避免各张量之间的数据覆盖;S2,采用内存共享和编址的方法,并通过特征图深度复制、算子执行顺序交换策略使编译器支持复杂的跳跃连接网络结构;S3,采用优化卷积循环平铺和循环重排的调度策略来提升加速器的性能。

    基于每像素监督的深度学习相机自动对焦方法及系统

    公开(公告)号:CN117528234A

    公开(公告)日:2024-02-06

    申请号:CN202311429590.5

    申请日:2023-10-31

    申请人: 重庆大学

    IPC分类号: H04N23/67

    摘要: 本发明属于自动对焦技术领域,具体公开了一种基于每像素监督的深度学习相机自动对焦方法及系统,该方法包括如下步骤:S1,采集多个场景的不同焦距的图像数据集;S2,计算图像对应的每像素最优焦距图M和最优焦距预测值F;S3,构建基于每像素监督的最优焦距预测模型A;S4,对最优焦距预测模型A进行训练,得到训练完成的最优焦距预测模型A’;S5,将离焦图像输入最优焦距预测模型A’中,得到最优焦距预测图M’和最优焦距预测值F’,将相机焦距设置为F’完成自动对焦。采用本技术方案,使用每像素最优焦距图监督训练,具有更高的最优焦距预测精度,避免了其他自动对焦方法需要二次调整的问题。

    一种激光雷达数据处理系统
    4.
    发明公开

    公开(公告)号:CN115184957A

    公开(公告)日:2022-10-14

    申请号:CN202210720316.2

    申请日:2022-06-23

    申请人: 重庆大学

    摘要: 本发明公开一种激光雷达数据处理系统,包括:中央处理模块,用于响应于用户输入的信息配置指令,将接收模块配置信息和预处理模块配置信息分别配置于接收模块和预处理模块;接收模块,用于当接收到激光雷达报文时,对激光雷达报文进行协议解析,获得激光雷达解析报文,并发送至预处理模块;预处理模块,用于当接收到激光雷达解析报文时,通过预处理程序对激光雷达解析报文进行预处理,获得激光雷达数据,并发送至加速器模块;加速器模块,用于对激光雷达数据进行计算处理,获得激光雷达数据计算结果。本发明能够显著降低中央处理模块的占用率,也能够防止激光雷达数据处理时延过长。

    一种感知数据处理系统及方法
    5.
    发明公开

    公开(公告)号:CN114817098A

    公开(公告)日:2022-07-29

    申请号:CN202210458311.7

    申请日:2022-04-28

    申请人: 重庆大学

    IPC分类号: G06F13/30 G06F13/16 G06F9/30

    摘要: 本发明公开了一种感知数据处理系统及方法,包括:统一传感接入单元对接收的感知数据进行格式转换并将格式转换后的感知数据发送至仲裁单元;所述仲裁单元基于预设的仲裁策略,确定所述感知数据的仲裁结果并将所述仲裁结果和所述感知数据发送至数据分发控制单元;所述数据分发控制单元根据所述仲裁结果配置DMA控制器中的DMA通道并发起DMA写请求;所述DMA控制器响应于所述DMA写请求,将所述感知数据通过配置好的DMA通道发送至目标数据处理模块。本发明的感知数据处理系统及方法,利用硬件模块设计数据通路以使不同的感知数据被直接搬运至对应的数据处理模块,无需CPU进行搬运控制,减少系统资源的浪费,降低了数据传输时延,适应实时性要求较高的无人设备。

    一种卷积神经网络的加速方法及卷积神经网络加速器

    公开(公告)号:CN114662684A

    公开(公告)日:2022-06-24

    申请号:CN202210333277.0

    申请日:2022-03-31

    申请人: 重庆大学

    摘要: 本发明公开了一种卷积神经网络的加速方法及卷积神经网络加速器,包括根据输入特征图数据的地址信息,将从片外存储器中读取到的输入特征图数据暂存至片上存储器的缓存区;在将读取到的输入特征图数据暂存至缓存区的过程中,获取当前暂存的输入特征图数据位于缓存区内的位置;当判断到位置位于预先确定的规定位置,对缓存区进行滑窗处理;在进行滑窗处理时,将滑窗内的所有输入特征图数据拼接成一个待填充输入数据,并将待填充输入数据的剩余通道进行填充处理,得到一个输入数据;利用预先读取到的权重数据,对输入数据进行乘累加运算,得到卷积计算结果。本发明实施例能够提高PE运算阵列进行乘累加运算的资源利用率,进而缩短运算时间。

    OCTA图像中视网膜血管分叉点和交叉点的检测方法

    公开(公告)号:CN113516643A

    公开(公告)日:2021-10-19

    申请号:CN202110789606.8

    申请日:2021-07-13

    申请人: 重庆大学

    摘要: 本发明提出了一种OCTA图像中视网膜血管分叉点和交叉点的检测方法,包括以下步骤:S1,使用堆叠沙漏网络提取和融合输入图像的特征;S2,将S1提取的特征输入三个预测分支来预测中心点热图、中心点的局部偏移和目标大小;S3,从三个预测分支中获得分类结果和血管特征点的位置信息。本发明可以直接同时对OCTA图像中的血管分叉点和交叉点进行检测和分类;且使用注意力门改进了CenterNet中的堆叠沙漏网络,注意力门可以突出OCTA图像中有价值的特征,并抑制不相关的特征激活,提高了检测性能。

    用于智能环境的分布式推理节点优化分配方法

    公开(公告)号:CN108199900B

    公开(公告)日:2019-11-05

    申请号:CN201810062163.0

    申请日:2018-01-23

    申请人: 重庆大学

    摘要: 本发明提出了一种用于智能环境的分布式推理节点优化分配方法,包括如下步骤:S1,根据智能环境采集传感器节点信息,通过传感器节点集合所采集的活动类型、积累的规则,推算出传感器网络活动类型之间的距离,并进行分类,然后分别构造传感器网络推理网络模型;S2,根据智能环境中传感器节点位置以及由传感器节点之间形成的传输邻接边,计算出传感器节点之间的最短距离并保存其传输路径信息;S3,对传感器网络进行资源分配评估和实时性评估,将传感器网络中的推理节点优化分配到各个传感器节点中,从而形成优化的分布式传感器网络。

    基于运动传感器的门禁控制系统

    公开(公告)号:CN102722929A

    公开(公告)日:2012-10-10

    申请号:CN201210201256.X

    申请日:2012-06-18

    申请人: 重庆大学

    IPC分类号: G07C9/00

    摘要: 本发明提出了一种基于运动传感器的门禁控制系统,属于门禁控制领域。该系统包括运动传感器阵列、传感器信号处理模块、路径识别模块、主控模块和门禁控制模块,运动传感器阵列检测人体的运动信息并将该运动信息转换为电信号传输给传感器信号处理模块;传感器信号处理模块根据电信号的接收时间将电信号处理成实际的人体移动路径,并将该实际的人体移动路径提供给路径识别模块;路径识别模块将该实际的人体移动路径与预先设定的合法移动路径进行比较,并将比较结果发送给该主控模块;主控模块在两者相同时发送开启指令给该门禁控制模块,门禁锁可开启,在两者不相同时发送报警指令给门禁控制模块,门禁锁不可开启。本发明基于运动传感器,安全性能更高。

    基于非语言特征的声音验证方法

    公开(公告)号:CN102438024A

    公开(公告)日:2012-05-02

    申请号:CN201210001478.7

    申请日:2012-01-05

    申请人: 重庆大学

    发明人: 汪成亮 何捷休

    IPC分类号: H04L29/06 H04L9/32 G10L15/00

    摘要: 本发明公开了一种基于非语言特征的声音验证方法,属于验证码领域。该方法在互联网中采用基于非语言特征的声音进行验证,该基于非语言特征是指人类可以识别但人类语言不能表达的特征。相比于基于语言特征的声音验证方法,不仅能够区分正常用户与恶意程序以及用户正常使用服务与用户恶意攻击行为,而且由于基于非语言特征的声音在数学上很难定义,即很难被软件识别,因此解决了基于语言特征的声音验证码容易被软件识别的问题,提高了验证的网络安全性且满足了诸如视力不佳者等更多用户的需求,此外,相比于传统的字符验证方式,克服了字符模糊且易被攻破的缺点。