一种嵌入式RDMA系统
    61.
    发明授权

    公开(公告)号:CN114726883B

    公开(公告)日:2023-04-07

    申请号:CN202210459192.7

    申请日:2022-04-27

    申请人: 重庆大学

    摘要: 本发明提供了一种嵌入式RDMA系统,包括:DMA控制模块、分布式访问处理模块、以太网协议栈模块、MAC模块、PHY模块;DMA控制模块,用于将获取到的多个远程访问指令通过多个DMA通道分别发送至所述分布式访问处理模块进行远程访问请求,并根据远程访问结果对分布式访问的相关参数进行修改;分布式访问处理模块,用于处理所述远程访问请求;以太网协议栈模块,用于接收分布式访问处理模块的远程访问指令。采用本发明实施例,能够将远程访问的所有功能均在硬件上完成,无需与CPU进行交互,减少嵌入式设备之间的访问延迟,提高了实时性。

    一种网络通讯协议与总线协议的转换装置及集群系统

    公开(公告)号:CN115297187A

    公开(公告)日:2022-11-04

    申请号:CN202210818132.X

    申请日:2022-07-12

    申请人: 重庆大学

    IPC分类号: H04L69/08 H04L67/025

    摘要: 本发明公开一种网络通讯协议与总线协议的转换装置及集群系统,该装置包括:总线转换模块,用于当接收到本地的访问请求信息时,基于全局地址映射关系表获得与该信息中的全局地址相对应的网络通讯地址,通过以太网控制模块向远程设备芯片的以太网控制模块发送远程访问报文;以太网控制模块,用于将远程访问报文发送至总线转换模块;总线转换模块,还用于基于总线地址映射关系表获得与远程访问报文中的全局地址相对应的本地总线地址,并对与本地总线地址相对应的硬件发送读/写请求指令,通过以太网控制模块向源设备芯片反馈读/写结果。本发明能够在无需CPU参与的情况下,实现集群系统中各个设备芯片之间的远程网络通讯任务及控制任务。

    专用于CNN加速器的深度学习编译器优化方法

    公开(公告)号:CN114995822A

    公开(公告)日:2022-09-02

    申请号:CN202210638258.9

    申请日:2022-06-07

    申请人: 重庆大学

    IPC分类号: G06F8/41 G06N3/04 G06N3/08

    摘要: 本发明提出了一种专用于CNN加速器的深度学习编译器优化方法,包括以下步骤:S1,通过算子融合和/或bn融合的优化方法减少加速器对内存的访问以及存储空间的浪费,同时使用内存分配地址叠加的方式避免各张量之间的数据覆盖;S2,采用固定硬件下的多种模型量化部署方案,通过融合非对称量化的偏移和卷积偏置;同时通过编译器与加速器的协同优化,将DSP的输入数据配置为两个数的移位相加从而在一个DSP中同时进行两次乘法运算,最终实现编译器对可变位宽量化的支持。

    一种卷积神经网络的加速方法及卷积神经网络加速器

    公开(公告)号:CN114692858A

    公开(公告)日:2022-07-01

    申请号:CN202210333224.9

    申请日:2022-03-31

    申请人: 重庆大学

    摘要: 本发明公开了一种卷积神经网络的加速方法及卷积神经网络加速器,包括:获取当前卷积层量化后的输入特征图数据;对所述输入特征图数据进行分割处理,得到第一输入特征图数据和第二输入特征图数据;将位于同一通道的第一输入特征图数据和第二输入特征图数据交替拼接,得到拼接输入特征图数据;利用预先读取到的权重数据,对所述拼接输入特征图数据进行乘累加运算,得到所述当前卷积层的卷积计算结果。采用本发明实施例能够提高PE运算阵列进行乘累加运算的资源利用率,进而缩短卷积神经网络的运算时间。

    一种考虑制程差异的持久内存的分配方法

    公开(公告)号:CN113971091A

    公开(公告)日:2022-01-25

    申请号:CN202111242108.8

    申请日:2021-10-25

    申请人: 重庆大学

    IPC分类号: G06F9/50 G06F3/06

    摘要: 本发明涉及内存分配技术领域,具体公开了一种考虑制程差异的持久内存的分配方法,包括步骤:将整个持久内存空间划分为大小相等的内存域,同一内存域具有相同的耐久性;结合不同内存域的耐久性,将整个持久内存空间划分为多个批次,不同批次中的页面设置有不同的分配优先级;在每个批次中,将最大可用内存段相同的页面用链表组织在一起成为一个桶,而得到不同的桶;在分配内存时,先分配优先级最高的批次,再在最优适配的桶中分配内存单元。最后将被分配了内存单元的页面放回到合适的批次和桶中。本发明充分考虑了页面之间和页面内部的磨损均衡,能够感知耐久差异,做到每一个页面的内存单元都能够被均匀地磨损,可最大程度地提高PM的使用寿命。

    基于CDA共享文档的健康医疗大数据质控系统和终端

    公开(公告)号:CN111524589B

    公开(公告)日:2021-04-30

    申请号:CN202010291476.0

    申请日:2020-04-14

    摘要: 本发明提出了一种基于CDA共享文档的健康医疗大数据质控系统和终端,包括:CDA共享文档获取模块,用于区域医疗大数据获取发现以及相关CDA共享文档进行挖掘,随机选取若干实验结果进行数据提取,验证数据获取过程中的准确性;CDA共享文档筛选模块,用于对类型匹配模块中的数据进行筛选,进行CDA共享文档的抽取与转换,通过类型数据模型对CDA共享文档进行二次筛选,从中抽取和转换用于数据安全预警的文档;数据质量控制模块,用于经过CDA共享文档筛选模块筛选之后的区域医疗大数据,将构建的文档指标和评价模型,开展CDA共享文档数据质量控制评价,并将评价结果与历史评价结果作比较,验证CDA共享文档数据安全的有效性和合理性。

    一种基于Retinaface算法的人脸口罩检测系统和方法

    公开(公告)号:CN112686214A

    公开(公告)日:2021-04-20

    申请号:CN202110105379.2

    申请日:2021-01-26

    申请人: 重庆大学

    IPC分类号: G06K9/00 G06N3/04 G06N3/08

    摘要: 本发明公开一种基于Retinaface算法的人脸口罩检测系统和方法,具体包括:S1:从监控系统中获取视频数据并进行处理得到待识别图像;S2:将待识别图像输入Retinaface算法模型,以对人脸进行识别得到人脸图像;S3:将人脸图像输入构建的口罩识别模型,输出概率值;若该概率值大于第一阈值,则表示该人脸戴了口罩,用绿色表示;若小于第一阈值,则表示该人脸未戴口罩,用红色表示。本发明在Retinaface算法模型上结合口罩检测模型,以对人脸口罩进行检测,且提高了口罩的检测速度和精度。

    一种智能环境下基于边缘设备规则推理的数据预部署方法

    公开(公告)号:CN112651506A

    公开(公告)日:2021-04-13

    申请号:CN202011545218.7

    申请日:2020-12-24

    申请人: 重庆大学

    发明人: 汪成亮 赵凯

    摘要: 本发明公开了一种智能环境下基于边缘设备规则推理的数据预部署方法,包括以下步骤:S1:提取规则中的特征计算作为统计单元,建立规则网络;S2:对规则进行解析和预处理;S3:根据统计单元建立轻量级特征表,提前对特征值进行计算和存储;S4:建立规则网络与特征表的直接引用关系,并实时监测轻量级特征表的内存使用量,设计LCT预部署;S1具体包括以下步骤:S101:获取时间序列数据流;S102:通过获取的数据流,进行规则推理。根据统计单元建立的轻量级特征表提前对特征值进行了计算和存储,通过让规则网络直接引用轻量级特征表中的特征值,避免了规则匹配期间对绝大多数原始数据的实时特征计算。

    面向用户需求的软件快速定义智能环境的规划选择方案推荐方法

    公开(公告)号:CN107895595B

    公开(公告)日:2020-06-19

    申请号:CN201711118647.4

    申请日:2017-11-14

    申请人: 重庆大学

    发明人: 汪成亮 马飞 曾卓

    IPC分类号: G16H50/20 G16H50/70

    摘要: 本发明提出了一种根据环境数据智能定义体验状态的规划方案推荐方法,包括:S1,收集用户相关的身体特征数据、疾病信息数据和病情危险情况信息数据,发送到用户层,形成用户层数据库;S2,根据用户层数据库所获取的用户相关数据,通过建立疾病看护需求层模型,然后读取专家知识树的相应专家知识,映射到需求层,将专家知识与用户疾病相匹配,获取看护目标;S3,映射看护需求和设备层,分解看护目标为原子需求,获取需要的服务;S4,收集所需智能设备的参数信息数据,对智能设备进行工作参数规划,得到规划策略的设备层匹配的约束条件,形成智能设备工作的若干优化运行方案,推荐给用户。