-
公开(公告)号:CN110163052B
公开(公告)日:2022-09-09
申请号:CN201810861147.8
申请日:2018-08-01
申请人: 腾讯科技(深圳)有限公司 , 北京大学
摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。
-
公开(公告)号:CN110147699A
公开(公告)日:2019-08-20
申请号:CN201810325819.3
申请日:2018-04-12
申请人: 北京大学 , 腾讯科技(深圳)有限公司
摘要: 本发明实施例公开了一种图像识别方法、装置以及相关设备,方法包括:根据多个样本视频以及与所述多个样本视频关联的多个辅助数据,生成识别模型的调整辅助参数;根据所述多个样本视频的分类误差参数以及所述调整辅助参数调整识别模型,当调整辅助参数和分类误差参数之和小于目标阈值时,将调整后的识别模型确定为用于识别视频中对象的属性类型的目标识别模型。采用本发明,可以提高图像识别的准确率。
-
公开(公告)号:CN110163052A
公开(公告)日:2019-08-23
申请号:CN201810861147.8
申请日:2018-08-01
申请人: 腾讯科技(深圳)有限公司 , 北京大学
摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。
-
-
公开(公告)号:CN107133921B
公开(公告)日:2020-03-06
申请号:CN201610108841.3
申请日:2016-02-26
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06T5/00
摘要: 本发明提供了一种基于多层次邻域嵌入的图像超分辨率重建方法和一种基于多层次邻域嵌入的图像超分辨率重建系统,其中,所述方法包括:对待处理图像进行可控金字塔分解操作,得到高通图像、低通剩余图像和多个方向上的带通子带图像;根据邻域嵌入算法对所述多个方向上的带通子带图像、所述高通图像和所述低通剩余图像分别进行重建处理,得到对应的高分辨率子带图像;对多个所述高分辨率子带图像进行所述可控金字塔分解操作的逆变换处理,以生成高分辨率图像。通过本发明的技术方案,可以有效地解决因直接重建图像的所有高频成分导致图像的纹理细节被平滑的问题,从而提高图像超分辨率重建的精确度。
-
公开(公告)号:CN110795973A
公开(公告)日:2020-02-14
申请号:CN201810877125.0
申请日:2018-08-03
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
摘要: 本发明提供一种多模态融合的动作识别方法、装置及计算机可读存储介质,方法包括:通过预设的单模态待训练数据对至少一个单模态待训练模型进行训练,获得至少一个单模态神经网络模型;在任意两个所述单模态神经网络模型之间添加信息流动连接,获得多模态待训练模型;通过预设的多模态待训练数据对所述多模态待训练模型进行训练,获得多模态神经网络模型;将待识别多模态数据添加至所述多模态神经网络模型中进行识别。从而能够实现对多模态待识别设备的处理,提高神经网络模型的性能。
-
公开(公告)号:CN108133459B
公开(公告)日:2021-04-09
申请号:CN201611093936.9
申请日:2016-12-01
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06T5/00
摘要: 本发明提供了一种深度图增强方法和一种深度图增强装置,其中,深度图增强方法包括:对训练集图像的多个图像特征信息进行提取,得到多个图像特征信息的第一联合特征;对测试集图像的多个图像特征信息进行提取,得到多个图像特征信息的第二联合特征;基于第一联合特征与第二联合特征的相似性,查找测试集图像在训练集图像的对应部分的最近邻;根据查找到的最近邻,对测试集图像进行邻域嵌入,用以重建测试集图像的高频信息、低频信息和梯度信息;利用全局优化方程结合高频信息、低频信息和梯度信息,得到增强后的测试集图像。通过本发明的技术方案,可以有效地增强深度图的结构和细节,提升深度图的视觉质量。
-
公开(公告)号:CN106327432A
公开(公告)日:2017-01-11
申请号:CN201510340991.2
申请日:2015-06-18
申请人: 北京大学 , 北大方正集团有限公司北京北大方正电子有限公司
IPC分类号: G06T5/00
摘要: 本发明提供了一种基于偏移量的图像修复方法及装置,所述方法包括:将待修复的目标图像和图像库中的图像构成图像立方;将图像立方中的所有图像划分图像块,获得目标图像的目标图像块和图像的图像块;获取目标图像中已知区域的图像块的主导偏移量;主导偏移量为统计的与已知区域的图像块相似的图像块的若干偏移量的集合;根据所述主导偏移量,采用能量方程分配策略对所述目标图像中缺失区域的像素点进行修复,获取修复后的目标图像;所述目标图像包括已知区域和缺失区域。上述方法及装置能够有效描述目标图像的结构信息,又能引入图像库的额外信息,使目标图像修复结构更加自然。
-
公开(公告)号:CN106780318B
公开(公告)日:2020-07-14
申请号:CN201510831521.6
申请日:2015-11-25
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
摘要: 本发明提出了一种人脸幻构方法和一种人脸幻构系统,其中,人脸幻构方法包括:获取低分辨率人脸图片;根据所述低分辨率人脸图片的光照分布和细节分布,调整训练集中的每幅训练集图片的光照分布和细节分布;根据调整后的所述每幅训练集图片,通过邻域嵌入方法建立高分辨率图像块;将所述高分辨率图像块进行合并,得到高分辨率人脸图片。通过本发明的技术方案,实现了一种光照适应的人脸幻构方法,使低分辨率人脸图片与每幅训练集图片光照一致,从而达到高频信息一致,便于进行高分辨率重建,提升了重建高分辨率人脸图片的准确性。
-
公开(公告)号:CN108133459A
公开(公告)日:2018-06-08
申请号:CN201611093936.9
申请日:2016-12-01
申请人: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06T5/00
CPC分类号: G06T5/001 , G06T5/009 , G06T2207/20081
摘要: 本发明提供了一种深度图增强方法和一种深度图增强装置,其中,深度图增强方法包括:对训练集图像的多个图像特征信息进行提取,得到多个图像特征信息的第一联合特征;对测试集图像的多个图像特征信息进行提取,得到多个图像特征信息的第二联合特征;基于第一联合特征与第二联合特征的相似性,查找测试集图像在训练集图像的对应部分的最近邻;根据查找到的最近邻,对测试集图像进行邻域嵌入,用以重建测试集图像的高频信息、低频信息和梯度信息;利用全局优化方程结合高频信息、低频信息和梯度信息,得到增强后的测试集图像。通过本发明的技术方案,可以有效地增强深度图的结构和细节,提升深度图的视觉质量。
-
-
-
-
-
-
-
-
-