一种面向RISC-V体系架构的实时目标检测方法及系统

    公开(公告)号:CN116434040A

    公开(公告)日:2023-07-14

    申请号:CN202310197228.3

    申请日:2023-03-03

    摘要: 本发明提供一种面向RISC‑V体系架构的实时目标检测方法及系统,涉及嵌入式系统领域。将寒武纪CNStream数据流处理SDK的环境依赖和CNToolkit及固件依次移植至RISC‑V体系架构中;移植寒武纪CNStream数据流处理SDK;加载离线模型文件;初始化嵌入式设备和MLU 220M.2;采集源数据,使用RTSP推流传入至寒武纪CNStream数据流处理SDK中;寒武纪CNStream数据流处理SDK对源数据进行处理,实现目标检测功能;目标检测结果通过RTSP推流至VLC媒体播放器进行展示。本发明通过使用Sifive Unmatched嵌入式设备和国产智能芯片寒武纪边缘端人工智能加速卡MLU 220M.2,运用寒武纪CNStream数据流处理SDK,实现面向RISC‑V体系架构的实时目标检测功能。

    针对神经网络算子融合的端云协同推理方法及装置

    公开(公告)号:CN115062784A

    公开(公告)日:2022-09-16

    申请号:CN202210666123.3

    申请日:2022-06-13

    IPC分类号: G06N5/04 G06N3/04 G06N3/08

    摘要: 本发明公开一种针对神经网络算子融合的端云协同推理方法及装置,所述方法包括将神经网络转换为有向无环图;将所述有向无环图切分为若干链式结构;对每一链式结构中的所述网络层进行融合操作,并使用得到的融合块替代被融合的网络层;依据待推理数据,预测每一融合块与每一未融合网络层的推理时间与输出数据大小,并根据所述输出数据大小与端云之间的网络带宽,计算中间数据传输时间;基于所述推理时间与所述中间数据传输时间,切分所述神经网络,并基于切分结果进行端云协同推理。本发明解决了具有可融合算子的网络模型的最小时延问题。

    一种边缘异构场景中的端云协同推理方法和系统

    公开(公告)号:CN115048218A

    公开(公告)日:2022-09-13

    申请号:CN202210650520.1

    申请日:2022-06-09

    摘要: 本发明公开了一种边缘异构场景中的端云协同推理方法和系统。该方法包括离线和在线的两个阶段。在离线阶段,得到各个节点CPU以及内存占用率与神经网络每层推理时间的逻辑回归函数。在线阶段动态获取CPU与内存使用率,实时更新当前CPU和内存压力值下的神经网络各层的执行时间,根据此时间选择最佳模型划分点与最优节点,以达到最大的系统吞吐量。本发明公开了一种边缘异构场景中的端云协同推理框架的组成原理,可以确定异构边缘计算系统的最佳边缘设备和模型划分点,应用于图像分类检测系统,达到系统高吞吐量要求。