自适应的神经网络训练与推理装置

    公开(公告)号:CN111191769B

    公开(公告)日:2024-03-05

    申请号:CN201911354506.1

    申请日:2019-12-25

    IPC分类号: G06N3/04 G06N3/084 G06N5/04

    摘要: 本发明公开了自适应的神经网络训练与推理装置,包括深度学习处理引擎阵列、存储模块以及自动更新控制模块,深度学习处理引擎阵列用于执行神经网络的训练与推理;存储模块用于存储神经网络每层的输出数据、每层的激励函数的求导值、每层的权重值以及训练样本;自动更新控制模块用于控制执行前向传播推理,并根据所监测的网络输出控制所述深度学习处理引擎阵列执行反向传播训练以更新神经网络的网络参数。利用上述模块,自适应的神经网络训练与推理装置能够直接在边缘端完成神经网络训练与推理,实现自动更新,能有效地提高深度学习网络的处理性能,降低功耗,并且免去了将训练过程转移至服务器端或云端而产生的额外交互成本。

    自适应的神经网络训练与推理装置

    公开(公告)号:CN111191769A

    公开(公告)日:2020-05-22

    申请号:CN201911354506.1

    申请日:2019-12-25

    IPC分类号: G06N3/04 G06N3/08 G06N5/04

    摘要: 本发明公开了自适应的神经网络训练与推理装置,包括深度学习处理引擎阵列、存储模块以及自动更新控制模块,深度学习处理引擎阵列用于执行神经网络的训练与推理;存储模块用于存储神经网络每层的输出数据、每层的激励函数的求导值、每层的权重值以及训练样本;自动更新控制模块用于控制执行前向传播推理,并根据所监测的网络输出控制所述深度学习处理引擎阵列执行反向传播训练以更新神经网络的网络参数。利用上述模块,自适应的神经网络训练与推理装置能够直接在边缘端完成神经网络训练与推理,实现自动更新,能有效地提高深度学习网络的处理性能,降低功耗,并且免去了将训练过程转移至服务器端或云端而产生的额外交互成本。

    图像识别方法、装置、设备和存储介质

    公开(公告)号:CN110175641A

    公开(公告)日:2019-08-27

    申请号:CN201910431366.7

    申请日:2019-05-22

    IPC分类号: G06K9/62 G06N3/04

    摘要: 本发明实施例公开了一种图像识别方法、装置、设备和存储介质,其中该方法包括:获取待识别的目标图像;利用预先构建的图像识别模型,得到目标图像的识别结果,图像识别模型通过对初始识别模型中的卷积层进行逐层8位整形量化得到,其中每个卷积层的目标输出系数为2的指数次幂。本发明实施例可以适用于FPGA等低功耗平台与芯片,无需耗费巨大计算资源,进而避免了对硬件平台的依赖,极大地提高了图像识别的识别效率,实现了图像识别的通用化。

    图像识别方法、装置、设备和存储介质

    公开(公告)号:CN110175641B

    公开(公告)日:2024-02-02

    申请号:CN201910431366.7

    申请日:2019-05-22

    摘要: 本发明实施例公开了一种图像识别方法、装置、设备和存储介质,其中该方法包括:获取待识别的目标图像;利用预先构建的图像识别模型,得到目标图像的识别结果,图像识别模型通过对初始识别模型中的卷积层进行逐层8位整形量化得到,其中每个卷积层的目标输出系数为2的指数次幂。本发明实施例可以适用于FPGA等低功耗平台与芯片,无需耗费巨大计算资源,进而避免了对硬件平台的依赖,极大地提高了图像识别的识别效率,实现了图像识别的通用化。

    可伸缩三维阵列的配置系统及方法、配置器、计算阵列器

    公开(公告)号:CN110045996A

    公开(公告)日:2019-07-23

    申请号:CN201910150205.0

    申请日:2019-02-28

    发明人: 黎江 王旭光

    IPC分类号: G06F9/445 G06F9/50

    摘要: 本发明公开了一种可伸缩三维阵列的配置系统,包括计算机设备、计算阵列器及连接计算机设备与计算阵列器的配置器,通过计算机设备发送配置指令至配置器,配置器接收配置指令并根据配置指令从计算机设备获取配置文件,并将获取的配置文件发送至计算阵列器,计算阵列器接收配置文件,并根据配置文件进行配置,从而实现对计算阵列的配置。本发明还公开了一种可伸缩三维阵列的配置方法。本发明也公开了一种配置器。本发明还公开了一种计算阵列器。本发明的配置过程由计算机设备下发配置指令后由配置器进行配置,不需CPU全程参与,极大降低CPU的占用率,提高配置速度。

    可重构的人工智能核心与异构多核芯片的自动设计方法

    公开(公告)号:CN111339027B

    公开(公告)日:2023-11-28

    申请号:CN202010116890.8

    申请日:2020-02-25

    IPC分类号: G06F15/78 G06N3/063 G06N3/10

    摘要: 本发明公开了可重构的人工智能核心与异构多核芯片的自动设计方法、基于神经网络应用的硬件资源调配方法,所述人工智能处理核心的自动设计方法中,能够针对不同网络对人工智能处理核心进行定制化设计,以在芯片乃至系统层面上获得更高的处理能效;由此,所述多核芯片的自动设计方法能根据对混合神经网络中的不同类型神经网络自动配置对应的人工智能处理核心,实现多个神经网络的同时并行处理,并且平衡了系统对各个神经网络的处理负荷;所述硬件资源调配方法能够根据不同上层应用的需求,配置对应的多核芯片,实现在不同处理场景处理不同神经网络模型,完成对各个人工智能处理核心的单独配置,进一步提高处理性能,降低延时,降低重构开销。

    点云优化方法、系统、电子设备及存储介质

    公开(公告)号:CN115546371A

    公开(公告)日:2022-12-30

    申请号:CN202211262451.3

    申请日:2022-10-14

    摘要: 本发明公开了一种点云优化方法、系统、电子设备及存储介质,该点云优化方法包括:获取目标物的初始点云和RGB图像;对所述初始点云进行预处理,得到预处理点云;对所述预处理点云进行网格化,得到网格化点云;计算所述网格化点云在所述RGB图像坐标系中的顶点坐标和法向量;根据所述顶点坐标和所述法向量对所述网格化点云进行可微渲染,并输出渲染结果;根据所述渲染结果及所述RGB图像计算损失函数,以迭代优化所述网格化点云。本发明提供的点云优化方法,通过获取目标物的RGB图像信息作为系统输入,以此指导点云优化的方向,这样就不需要增加额外的设备,避免了系统搭建的冗余已经成本的上升。

    可伸缩三维阵列的配置系统及方法、配置器、计算阵列器

    公开(公告)号:CN110045996B

    公开(公告)日:2022-07-05

    申请号:CN201910150205.0

    申请日:2019-02-28

    发明人: 黎江 王旭光

    IPC分类号: G06F9/445 G06F9/50

    摘要: 本发明公开了一种可伸缩三维阵列的配置系统,包括计算机设备、计算阵列器及连接计算机设备与计算阵列器的配置器,通过计算机设备发送配置指令至配置器,配置器接收配置指令并根据配置指令从计算机设备获取配置文件,并将获取的配置文件发送至计算阵列器,计算阵列器接收配置文件,并根据配置文件进行配置,从而实现对计算阵列的配置。本发明还公开了一种可伸缩三维阵列的配置方法。本发明也公开了一种配置器。本发明还公开了一种计算阵列器。本发明的配置过程由计算机设备下发配置指令后由配置器进行配置,不需CPU全程参与,极大降低CPU的占用率,提高配置速度。

    可重构的人工智能核心与异构多核芯片的自动设计方法

    公开(公告)号:CN111339027A

    公开(公告)日:2020-06-26

    申请号:CN202010116890.8

    申请日:2020-02-25

    IPC分类号: G06F15/78 G06N3/063

    摘要: 本发明公开了可重构的人工智能核心与异构多核芯片的自动设计方法、基于神经网络应用的硬件资源调配方法,所述人工智能处理核心的自动设计方法中,能够针对不同网络对人工智能处理核心进行定制化设计,以在芯片乃至系统层面上获得更高的处理能效;由此,所述多核芯片的自动设计方法能根据对混合神经网络中的不同类型神经网络自动配置对应的人工智能处理核心,实现多个神经网络的同时并行处理,并且平衡了系统对各个神经网络的处理负荷;所述硬件资源调配方法能够根据不同上层应用的需求,配置对应的多核芯片,实现在不同处理场景处理不同神经网络模型,完成对各个人工智能处理核心的单独配置,进一步提高处理性能,降低延时,降低重构开销。