-
公开(公告)号:CN118839740A
公开(公告)日:2024-10-25
申请号:CN202310470198.9
申请日:2023-04-25
申请人: 华为技术有限公司
IPC分类号: G06N3/082 , G06N3/0464
摘要: 一种神经网络的剪枝方法、数据处理方法及装置,涉及深度学习领域,用以提供一种平衡推理性能和准确率的剪枝方式。本申请提供一种互补稀疏方式,权重张量中每K个M长的剪枝向量拼接为一个数据块(或者向量),经过稀疏后,一个剪枝向量中非零元素所在的位置,在该剪枝向量所属的数据块中的其它剪枝向量在该位置为零元素。相比采用单通道或者按块稀疏方式,本申请实施例采用更小的粒度来稀疏,可以提高网络模型的应用的准确度。相比采用任意稀疏方式来说,按照互补的方式来进行稀疏,在推理阶段无需采用稠密计算,减少了模型的计算量。本申请实施例提供的方案能够在准确度和加速上进行平衡。
-
公开(公告)号:CN116883715A
公开(公告)日:2023-10-13
申请号:CN202310627422.0
申请日:2023-05-30
申请人: 华为技术有限公司
IPC分类号: G06V10/764 , G06V10/74 , G06V10/77 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0895
摘要: 一种数据处理方法,应用于图像处理,方法包括:获取第一图像和第二图像;第一图像和第二图像包含文本;通过第一神经网络,得到第一图像和第二图像的图像特征;通过第二神经网络,得到第一图像和第二图像中包含的文本的文本特征,将第一特征表示和第三特征表示融合得到第一目标特征表示;将第二特征表示和第四特征表示融合得到第二目标特征表示;根据第一目标特征表示和第二目标特征表示之间的关系,确定损失,并根据损失更新第一神经网络。本申请通过提取包含文本的图像的图像特征以及文本特征,并将图像特征和文本特征进行融合,利用融合后的特征表示进行模型的更新,可以提高训练后的模型对包含文本的图像的识别精度。
-
公开(公告)号:CN116309226A
公开(公告)日:2023-06-23
申请号:CN202310277464.6
申请日:2023-03-15
申请人: 华为技术有限公司
IPC分类号: G06T5/50 , G06V10/74 , G06V10/40 , G06N3/0464 , G06N3/0455 , G06N3/08 , G06N3/048
摘要: 本申请公开了一种图像处理方法及其相关设备,可以令多个低动态范围LDR图像实现更加优质的融合,从而使得最终得到的HDR图像不存在伪影。本申请的方法包括:当需要获取目标对象的高动态范围HDR图像时,可先采集目标对象的第一LDR图像以及目标对象的第二LDR图像,并将第一LDR图像和第二LDR图像输入至目标模型中。那么,目标模型可对第一LDR图像和第二LDR图像进行图像块匹配,从而得到第一LDR图像的多个第一图像块与第二LDR图像的多个第二图像块之间的一一对应关系。然后,目标模型可利用该对应关系对第一LDR图像和第二LDR图像进行融合,从而得到并输出目标对象的HDR图像。
-
公开(公告)号:CN110473137B
公开(公告)日:2021-09-14
申请号:CN201910336216.8
申请日:2019-04-24
申请人: 华为技术有限公司
摘要: 本申请提供了一种图像处理方法,该方法包括:获取输入特征图;根据存储的多个基础卷积核和组合参数,对所述输入特征图进行卷积得到输出特征图,其中,所述组合参数用于指示所述多个基础卷积核组合成标准卷积核的排列顺序,所述基础卷积核的尺寸小于所述标准卷积核的尺寸;基于所述输出特征图进行图像处理,得到处理结果。本申请实施例提供的图像处理方法,能够减少进行图像处理所需使用的卷积神经网络模型的存储空间。
-
公开(公告)号:CN112529149A
公开(公告)日:2021-03-19
申请号:CN202011381498.2
申请日:2020-11-30
申请人: 华为技术有限公司
摘要: 本申请实施例公开了一种数据处理方法,应用于人工智能领域,包括:获取待压缩网络和多个数据,所述待压缩网络为分类网络;将所述多个数据输入所述待压缩网络,得到多个第一输出结果,所述多个第一输出结果与所述多个数据之间一一对应;确定所述多个第一输出结果中每个第一输出结果所对应的独热one‑hot标签;分别确定所述多个第一输出结果中每个第一输出结果与所述one‑hot标签之间的第一相似度;根据所述多个第一输出结果中每个第一输出结果对应的所述第一相似度,在所述多个数据中确定至少一个目标数据,所述至少一个目标数据用于压缩所述待压缩网络。通过该方法,能够获得大量与待压缩网络的原训练数据相近的数据,从而保证能够有效地实现网络的压缩。
-
公开(公告)号:CN111797881B
公开(公告)日:2024-06-28
申请号:CN201910695762.0
申请日:2019-07-30
申请人: 华为技术有限公司
IPC分类号: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
摘要: 本申请涉及人工智能领域中计算机视觉领域的图像识别技术,提供了一种图像分类方法及装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取待处理图像的输入特征图;根据神经网络的特征提取核,对所述输入特征图进行特征提取处理,得到输出特征图,其中,所述多个所述输出子特征图中的每一个是根据对应的一个所述输入子特征图与所述特征提取核确定的,至少一个所述输出子特征图是根据取绝对值后的目标矩阵确定得到的,所述目标矩阵与其对应的所述输入子特征图的差为所述特征提取核;基于所述输出特征图对所述待处理图像进行分类,得到所述待处理图像的分类结果。该方法能够减少卷积神经网络模型的运算开销。
-
公开(公告)号:CN111382867B
公开(公告)日:2024-04-16
申请号:CN202010105175.4
申请日:2020-02-20
申请人: 华为技术有限公司
IPC分类号: G06N3/082 , G06N3/0464 , G06F17/14
摘要: 本申请提供一种神经网络压缩的方法、数据处理的方法及相关装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:对待压缩的三维卷积神经网络包括的第一三维卷积核执行以下操作:在该第一三维卷积核的时间维度上对该第一三维卷积核进行正交变换;根据正交变换后的该第一三维卷积核在时间维度上的稀疏性,对该第一三维卷积核的时间维度进行剪枝,得到压缩后的三维卷积神经网络。本申请通过在待压缩的三维卷积神经网络的三维卷积核的时间维度上对该三维卷积核进行正交变换,并对正交变换后的三维卷积核的稀疏的时间维度进行剪枝,相对于现有技术,可以进一步减少三维卷积神经网络的参数量与计算量。
-
公开(公告)号:CN117456297A
公开(公告)日:2024-01-26
申请号:CN202311140966.0
申请日:2019-03-31
申请人: 华为技术有限公司
IPC分类号: G06V10/774 , G06V10/776 , G06V10/778 , G06V10/82 , G06V10/764 , G06V30/19 , G06V40/16 , G06N3/0495 , G06N3/044 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/0475 , G06N3/084 , G06N3/088
摘要: 本发明公开了人工智能领域中的一种图像生成方法、神经网络的压缩方法及相关装置、设备,该图像生成方法包括将第一矩阵输入初始图像生成器,得到生成图像;将生成图像输入预设判别器,得到判别结果,其中,预设判别器是经过真实图像和所述真实图像对应的分类训练得到的;根据判别结果更新初始图像生成器,得到目标图像生成器;进而,将第二矩阵输入目标图像生成器,得到样本图像。进一步地,还公开一种神经网络的压缩方法,基于上述图像生成方法得到的样本图像对预设判别器进行压缩。
-
公开(公告)号:CN117422131A
公开(公告)日:2024-01-19
申请号:CN202311197434.0
申请日:2023-09-15
申请人: 华为技术有限公司
IPC分类号: G06N3/0985 , G06N3/0495
摘要: 提供了一种模型训练方法训练设备。该方法包括:将第二输入数据输入第一模型,确定第一输出数据,以及将所述第二输入数据输入第二模型,确定第二输出数据,其中,所述第二模型至少基于第一输入数据训练获得,所述第二输入数据基于所述第一输入数据进行处理得到;根据所述第一输出数据和所述第二输出数据确定所述第一模型的第一蒸馏损失值:根据所述第一蒸馏损失值更新所述第一模型的参数。该方法中,将基于第一输入数据得到的第二输入数据作为第一模型和第二模型的输入,根据两个模型的输出更新第一模型的参数,可以使第一模型充分学习第二模型的先验知识,提升第一模型的性能。
-
公开(公告)号:CN116309074A
公开(公告)日:2023-06-23
申请号:CN202310332363.4
申请日:2023-03-23
申请人: 华为技术有限公司
IPC分类号: G06T3/40 , G06V10/774 , G06T9/00 , G06N3/08 , G06N3/0464
摘要: 一种数据处理方法,应用于图像处理,例如新视角生成领域,方法包括:获取第一图像;根据第一图像的下采样图像的一个第一连续区域内的像素点的位置信息以及方向信息,通过NeRF网络,预测每个像素点的第一颜色值;第一颜色值用于确定第一连续区域对应的低分辨率图像;根据第二图像中与第一连续区域对应的图像区域、以及低分辨率图像,通过第一编码器处理得到第一特征表示;根据第一特征表示,通过第一解码器,得到第一低分辨率图像对应的超分图像。本申请中NeRF在每批次进行采样的像素属于连续的区域,NeRF每批次得到一个连续区域内的像素的颜色信息,因此,可以将NeRF之后连接SR网络,以生成场景低分辨率低频的新视角渲染结果。
-
-
-
-
-
-
-
-
-