-
公开(公告)号:CN109670380B
公开(公告)日:2022-12-27
申请号:CN201710955087.1
申请日:2017-10-13
申请人: 华为技术有限公司
摘要: 本申请提供了一种动作识别、姿势估计的方法及装置。涉及人工智能领域,具体涉及计算机视觉领域。该动作识别方法包括:确定待处理视频,所述待处理视频为包含人体图像的视频;根据所述待处理视频确定待处理图像;对所述待处理图像进行卷积处理,得到多个特征向量,其中,所述多个特征向量分别用于表示所述待处理图像不同位置的特征;根据所述多个特征向量确定所述人体的人体关节的权重系数集合;根据所述人体关节的权重系数集合对所述多个特征向量进行加权处理,得到所述人体关节的动作特征;根据所述人体关节的动作特征确定所述人体的动作特征;根据所述人体的动作特征,确定所述人体的动作类型。本申请能够提高动作识别的准确率。
-
公开(公告)号:CN111860588B
公开(公告)日:2024-06-21
申请号:CN202010538179.1
申请日:2020-06-12
申请人: 华为技术有限公司
IPC分类号: G06V10/764 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/084
摘要: 本申请涉及人工智能领域中的小样本学习技术,公开了一种用于图神经网络的训练方法以及相关设备。方法包括:将包括测试图像和N类训练图像的训练图像集合输入图神经网络,以获取第一相似度信息和测试图像的生成分类类别,第一相似度信息指示测试图像的特征与N类中每类训练图像的特征之间的相似度;根据第一损失函数和第二损失函数对图神经网络进行训练;第一损失函数的目标为提高测试图像的特征与正确分类类别的训练图像的特征之间的相似度,第二损失函数的目标为拉近生成分类类别和正确分类类别的相似度,增设第一损失函数的约束,更加充分利用训练阶段的样本中的信息,提高图神经网络的特征表达能力,以提高图神经网络输出结果的精度。
-
公开(公告)号:CN104679779B
公开(公告)日:2019-02-01
申请号:CN201310631901.6
申请日:2013-11-29
申请人: 华为技术有限公司
IPC分类号: G06F16/28
摘要: 本发明实施例公开了一种视频分类的方法和装置,涉及电子信息技术领域,能够提高视频分类的精确度。本发明的方法包括:按照时间顺序对样本视频库中的视频进行分段并得到分段结果,并生成运动原子集合;利用所述运动原子集合和所述分段结果,生成能够表达复杂运动模式的运动短语集合,并生成基于所述运动短语集合的所述样本视频库中的视频的描述向量;利用所述描述向量,确定与所述样本视频库中的视频的类型相同的待检测视频。本发明适用于视频分类的场景中。
-
公开(公告)号:CN104679779A
公开(公告)日:2015-06-03
申请号:CN201310631901.6
申请日:2013-11-29
申请人: 华为技术有限公司
IPC分类号: G06F17/30
CPC分类号: G06K9/00718 , G06F17/30781 , G06F17/30784 , G06F17/30811 , G06K9/00724 , G06K9/00744 , G06K9/00758 , G06K9/00765 , G06K9/6218
摘要: 本发明实施例公开了一种视频分类的方法和装置,涉及电子信息技术领域,能够提高视频分类的精确度。本发明的方法包括:按照时间顺序对样本视频库中的视频进行分段并得到分段结果,并生成运动原子集合;利用所述运动原子集合和所述分段结果,生成能够表达复杂运动模式的运动短语集合,并生成基于所述运动短语集合的所述样本视频库中的视频的描述向量;利用所述描述向量,确定与所述样本视频库中的视频的类型相同的待检测视频。本发明适用于视频分类的场景中。
-
公开(公告)号:CN107545262B
公开(公告)日:2020-11-06
申请号:CN201710642311.1
申请日:2017-07-31
申请人: 华为技术有限公司
摘要: 一种在自然场景图像中检测文本的方法及装置,用以解决现有技术中从不同复杂程度的自然场景图像中检测文本精度较低的问题。该方法包括:获取自然场景图像,通过FCN模型,对获取的自然场景图像进行卷积运算,得到自然场景图像的卷积特征,根据自然场景图像的卷积特征,确定自然场景图像中包括的文本候选区域序列,针对文本候选区域序列中的每一文本候选区域,执行:通过感兴趣区域池化层,提取文本候选区域的卷积特征,并通过特征变换,将文本候选区域的卷积特征,转化为固定维度k的特征向量,根据时间递归网络模型和固定维度k的特征向量,确定文本候选区域中包括的文本行的位置,其中k为正整数。
-
公开(公告)号:CN111860588A
公开(公告)日:2020-10-30
申请号:CN202010538179.1
申请日:2020-06-12
申请人: 华为技术有限公司
摘要: 本申请涉及人工智能领域中的小样本学习技术,公开了一种用于图神经网络的训练方法以及相关设备。方法包括:将包括测试图像和N类训练图像的训练图像集合输入图神经网络,以获取第一相似度信息和测试图像的生成分类类别,第一相似度信息指示测试图像的特征与N类中每类训练图像的特征之间的相似度;根据第一损失函数和第二损失函数对图神经网络进行训练;第一损失函数的目标为提高测试图像的特征与正确分类类别的训练图像的特征之间的相似度,第二损失函数的目标为拉近生成分类类别和正确分类类别的相似度,增设第一损失函数的约束,更加充分利用训练阶段的样本中的信息,提高图神经网络的特征表达能力,以提高图神经网络输出结果的精度。
-
公开(公告)号:CN109902547B
公开(公告)日:2020-04-28
申请号:CN201810533284.9
申请日:2018-05-29
申请人: 华为技术有限公司
摘要: 本申请提供了动作识别方法和装置。该方法包括:获取待处理图片;提取待处理图片的空间特征;根据待处理图片的空间特征以及预设的特征库中的X个空间特征和X个光流特征,确定待处理图片的虚拟光流特征,其中,预设特征库中的X个空间特征和X个光流特征存在一一对应关系,X为大于1的整数;根据待处理图片的虚拟光流特征与预设特征库中的Y个光流特征的相似度,确定待处理图片在不同动作类别上的第一类置信度,其中,预设特征库中的Y个光流特征每个光流特征对应一种动作类别,Y为大于1的整数;根据第一类置信度确定待处理图片的动作类别。本申请能够提高动作识别的准确率。
-
公开(公告)号:CN113221929A
公开(公告)日:2021-08-06
申请号:CN202010080653.0
申请日:2020-02-05
申请人: 华为技术有限公司
摘要: 本申请实施例公开了一种图像处理方法以及相关设备,该方法应用于人工智能领域中,执行设备在获取到目标图像的先验框集后,根据先验框集构建边框集,并据此确定先验框集中的每个先验框与各个边框的相关性,最终根据相关性就可确定任意一个先验框包括的目标对象的位置和/或类别。在本申请中,通过对边框集进行一系列的变换操作,将各个边框的特征融入到先验框的特征中来,增加先验框内所包括的物体的区分度,从而创造性地利用了目标图像中物体周围的背景信息来帮助该物体的定位或分类,进而解决了小样本条件下目标图像中的物体类别容易混淆的问题,显著提高了检测的准确性。
-
公开(公告)号:CN109902547A
公开(公告)日:2019-06-18
申请号:CN201810533284.9
申请日:2018-05-29
申请人: 华为技术有限公司
摘要: 本申请提供了动作识别方法和装置。该方法包括:获取待处理图片;提取待处理图片的空间特征;根据待处理图片的空间特征以及预设的特征库中的X个空间特征和X个光流特征,确定待处理图片的虚拟光流特征,其中,预设特征库中的X个空间特征和X个光流特征存在一一对应关系,X为大于1的整数;根据待处理图片的虚拟光流特征与预设特征库中的Y个光流特征的相似度,确定待处理图片在不同动作类别上的第一类置信度,其中,预设特征库中的Y个光流特征每个光流特征对应一种动作类别,Y为大于1的整数;根据第一类置信度确定待处理图片的动作类别。本申请能够提高动作识别的准确率。
-
公开(公告)号:CN109670380A
公开(公告)日:2019-04-23
申请号:CN201710955087.1
申请日:2017-10-13
申请人: 华为技术有限公司
IPC分类号: G06K9/00
摘要: 本申请提供了一种动作识别、姿势估计的方法及装置。该动作识别方法包括:确定待处理视频,所述待处理视频为包含人体图像的视频;根据所述待处理视频确定待处理图像;对所述待处理图像进行卷积处理,得到多个特征向量,其中,所述多个特征向量分别用于表示所述待处理图像不同位置的特征;根据所述多个特征向量确定所述人体的人体关节的权重系数集合;根据所述人体关节的权重系数集合对所述多个特征向量进行加权处理,得到所述人体关节的动作特征;根据所述人体关节的动作特征确定所述人体的动作特征;根据所述人体的动作特征,确定所述人体的动作类型。本申请能够提高动作识别的准确率。
-
-
-
-
-
-
-
-
-