-
公开(公告)号:CN110163052B
公开(公告)日:2022-09-09
申请号:CN201810861147.8
申请日:2018-08-01
申请人: 腾讯科技(深圳)有限公司 , 北京大学
摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。
-
公开(公告)号:CN110147699A
公开(公告)日:2019-08-20
申请号:CN201810325819.3
申请日:2018-04-12
申请人: 北京大学 , 腾讯科技(深圳)有限公司
摘要: 本发明实施例公开了一种图像识别方法、装置以及相关设备,方法包括:根据多个样本视频以及与所述多个样本视频关联的多个辅助数据,生成识别模型的调整辅助参数;根据所述多个样本视频的分类误差参数以及所述调整辅助参数调整识别模型,当调整辅助参数和分类误差参数之和小于目标阈值时,将调整后的识别模型确定为用于识别视频中对象的属性类型的目标识别模型。采用本发明,可以提高图像识别的准确率。
-
-
公开(公告)号:CN110163052A
公开(公告)日:2019-08-23
申请号:CN201810861147.8
申请日:2018-08-01
申请人: 腾讯科技(深圳)有限公司 , 北京大学
摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。
-
公开(公告)号:CN107133921B
公开(公告)日:2020-03-06
申请号:CN201610108841.3
申请日:2016-02-26
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06T5/00
摘要: 本发明提供了一种基于多层次邻域嵌入的图像超分辨率重建方法和一种基于多层次邻域嵌入的图像超分辨率重建系统,其中,所述方法包括:对待处理图像进行可控金字塔分解操作,得到高通图像、低通剩余图像和多个方向上的带通子带图像;根据邻域嵌入算法对所述多个方向上的带通子带图像、所述高通图像和所述低通剩余图像分别进行重建处理,得到对应的高分辨率子带图像;对多个所述高分辨率子带图像进行所述可控金字塔分解操作的逆变换处理,以生成高分辨率图像。通过本发明的技术方案,可以有效地解决因直接重建图像的所有高频成分导致图像的纹理细节被平滑的问题,从而提高图像超分辨率重建的精确度。
-
公开(公告)号:CN110795973A
公开(公告)日:2020-02-14
申请号:CN201810877125.0
申请日:2018-08-03
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
摘要: 本发明提供一种多模态融合的动作识别方法、装置及计算机可读存储介质,方法包括:通过预设的单模态待训练数据对至少一个单模态待训练模型进行训练,获得至少一个单模态神经网络模型;在任意两个所述单模态神经网络模型之间添加信息流动连接,获得多模态待训练模型;通过预设的多模态待训练数据对所述多模态待训练模型进行训练,获得多模态神经网络模型;将待识别多模态数据添加至所述多模态神经网络模型中进行识别。从而能够实现对多模态待识别设备的处理,提高神经网络模型的性能。
-
公开(公告)号:CN106558018A
公开(公告)日:2017-04-05
申请号:CN201510621555.2
申请日:2015-09-25
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06T3/40
CPC分类号: G06T3/4053
摘要: 本发明公开一种基于构件分解的视频人脸幻构方法及装置,能够提高低分辨率人脸视频的人脸幻构的性能。所述方法包括:对于待进行人脸幻构的低分辨率人脸视频的每一帧图像,将该帧图像中的人脸部分按照人脸结构进行分解,并将分解得到的各个人脸部分分割成图像块;对于分割得到的每一个图像块,从预设的图像块库中获取该图像块的预设数量个最近邻图像块;对于所述低分辨率人脸视频的每一帧图像,利用所述最近邻图像块,采用基于局部约束的邻域嵌入的方法重建该帧图像分割得到的所述图像块,得到高分辨率图像块,通过将所述高分辨率图像块合并得到目标高分辨率图像;将各个目标高分辨率图像进行合并,得到目标高分辨率人脸视频。
-
公开(公告)号:CN108573197A
公开(公告)日:2018-09-25
申请号:CN201710146933.5
申请日:2017-03-13
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
摘要: 本发明提供一种视频动作检测方法及装置,其中方法包括:从训练集中选取训练视频,获取训练视频中每一帧图像的骨架数据以及对图像中动作的识别结果和预测结果;利用神经网络对每一帧图像的骨架数据进行处理,获取每一帧图像的识别信息和预测信息;根据所述识别信息与识别结果、以及所述预测信息与预测结果,对神经网络进行优化;重复上述步骤,直至神经网络收敛;在神经网络收敛后,利用神经网络对待测视频中每帧图像的骨架数据进行处理,得到相应的识别信息和预测信息。本发明提供的视频动作检测方法及装置,能够对视频中每一帧图像进行识别,无需手动提取视频片段,提高了检测效率和准确性。
-
公开(公告)号:CN105096249B
公开(公告)日:2018-06-26
申请号:CN201410222467.0
申请日:2014-05-23
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
摘要: 本发明提供一种图像处理方法和装置,通过按照预先处理训练集中的图像对所采用的分割规则,将待处理的照片或者素描图像分割成N个大小相同的第一图像块,然后确定每个第一图像块与预先对训练集中的图像对应用聚类算法处理所获取的M个类之间的对应关系,根据预先训练的、与每个第一图像块归属的类所对应的训练参数获取与每个第一图像块对应的第二图像块,最后根据获取的与所述N个第一图像块对应的N个第二图像块合成与所述待处理的照片或者素描图像对应的素描图像或者照片,实现了通过字典学习法进行照片与素描图片之间的相互合成,避免出现人工制造的小块,提高了合成效果的清晰度。
-
公开(公告)号:CN105096249A
公开(公告)日:2015-11-25
申请号:CN201410222467.0
申请日:2014-05-23
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
摘要: 本发明提供一种图像处理方法和装置,通过按照预先处理训练集中的图像对所采用的分割规则,将待处理的照片或者素描图像分割成N个大小相同的第一图像块,然后确定每个第一图像块与预先对训练集中的图像对应用聚类算法处理所获取的M个类之间的对应关系,根据预先训练的、与每个第一图像块归属的类所对应的训练参数获取与每个第一图像块对应的第二图像块,最后根据获取的与所述N个第一图像块对应的N个第二图像块合成与所述待处理的照片或者素描图像对应的素描图像或者照片,实现了通过字典学习法进行照片与素描图片之间的相互合成,避免出现人工制造的小块,提高了合成效果的清晰度。
-
-
-
-
-
-
-
-
-