-
公开(公告)号:CN109089133B
公开(公告)日:2020-08-11
申请号:CN201810892997.4
申请日:2018-08-07
申请人: 北京市商汤科技开发有限公司
IPC分类号: H04N21/232 , H04N21/432 , H04N21/234 , H04N21/44
摘要: 本公开涉及一种视频处理方法及装置、电子设备和存储介质,所述方法包括:根据查询文本段落的段落信息和视频库中多个视频的视频信息,确定多个视频中与查询文本段落相关联的预选视频;根据预选视频的视频帧信息和查询文本段落的语句信息,确定预选视频中的目标视频。根据本公开的实施例的视频处理方法,可通过视频与查询文本段落的相关性来检索视频,可精确查找目标视频,避免查询结果冗余,并可处理自然语言形式的查询文本段落,不会受到内容标签的固有内容的限制。
-
公开(公告)号:CN106570453B
公开(公告)日:2020-03-03
申请号:CN201610876667.7
申请日:2016-09-29
申请人: 北京市商汤科技开发有限公司
摘要: 本申请公开了一种用于行人检测的方法、装置和系统。其中一种所述系统包括:第一框生成器,用于从多个行人训练图像生成候选框;训练图像块生成器,用于从基准框和由第一框生成器生成的候选框生成训练局部图像块;检测器训练单元,用于从训练局部图像块训练局部检测器;检测器选择单元,用于从所有经过训练的局部检测器中选择互补的局部检测器;第二框生成器,用于从多个行人测试图像生成候选框;测试图像块生成器,用于从由第二框生成器生成的候选框生成测试局部图像块;以及测试单元,用于从测试局部图像块和所选的局部检测器生成检测结果。
-
公开(公告)号:CN106407991B
公开(公告)日:2020-02-11
申请号:CN201610825966.8
申请日:2016-09-14
申请人: 北京市商汤科技开发有限公司
摘要: 本申请公开了图像属性识别方法和系统以及相关网络训练方法和系统。图像属性识别方法包括:从图像提取特征图,特征图包含图像的属性;从特征图识别出多个备选属性;分别确定多个备选属性的置信度;以及根据确定的各置信度从多个备选属性中确定出至少一备选属性来作为图像的属性。本申请的图像属性识别方法和系统提高了图像属性识别的准确性。
-
公开(公告)号:CN106462724B
公开(公告)日:2019-08-02
申请号:CN201480077597.8
申请日:2014-04-11
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06K9/00
CPC分类号: G06K9/00288 , G06K9/00281 , G06K9/4628 , G06T7/143 , G06T7/68 , G06T2207/20084 , G06T2207/30201
摘要: 本发明公开了基于规范化图像校验面部图像的系统和方法。该方法包括:从标识的多个面部图像中获得具有最小正面测量值的面部图像以作为标识的代表图像;基于所获得的代表图像与标识的多个面部图像之间的映射确定图像重建网络的参数;通过具有所确定的参数的图像重建网络将至少两个输入面部图像分别重建成相应的规范化图像;以及比较所重建的规范化图像以校验所重建的规范化图像是否属于同一标识,其中代表图像是正面图像以及正面测量值代表每个面部图像的对称性以及面部图像的锐度。通过本方法和系统,可通过仅使用来自原始的处于任意姿态和光照条件下的面部图像的2D信息容易地重建规范化面部图像。
-
公开(公告)号:CN109325141A
公开(公告)日:2019-02-12
申请号:CN201810836743.0
申请日:2018-07-26
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06F16/58 , G06F16/53 , G06F16/583
摘要: 本公开涉及一种图像检索方法及装置、电子设备和存储介质。所述方法应用于待检索图像序列集合中,所述方法包括:根据检索对象的检索图像确定待检索图像序列集合中各待检索图像的置信度;根据关联图像的置信度、目标图像与关联图像的特征相似度确定目标图像的关联置信度,并根据关联置信度和目标图像的置信度中的最大值,更新目标图像的置信度;在满足收敛条件时停止更新目标图像的置信度,根据停止更新后得到的目标图像的置信度,在待检索图像序列集合中确定与所述检索图像对应的图像检索结果。本公开实施例可以使得关联图像中的最高置信度得以快速传播,提高待检索图像的置信度传播的稳定性,提高检索结果的准确率。
-
公开(公告)号:CN106688011B
公开(公告)日:2018-12-28
申请号:CN201480081846.0
申请日:2014-09-10
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06T1/40
摘要: 公开一种用于训练多类别物体检测的神经网络的装置。该装置可包括特征学习单元和子框检测器单元。根据本申请的一个实施例,特征学习单元被配置成:基于第一训练图像集的训练图像来确定第一神经网络,其中每个图像中有多个边界框,边界框的内部具有物体,并且所确定的第一神经网络给出输入图像的上下文信息;以及基于第一训练图像集中的图像的边界框来确定第二神经网络,随后基于第二训练集中的图像的边界框来进一步微调第二神经网络。子框检测器单元被配置成基于第二神经网络来确定用于边界框的子框检测器得分,子框检测器的每个预测得分用于一个边界框的一个语义物体类别的一个值。
-
公开(公告)号:CN109089133A
公开(公告)日:2018-12-25
申请号:CN201810892997.4
申请日:2018-08-07
申请人: 北京市商汤科技开发有限公司
IPC分类号: H04N21/232 , H04N21/432 , H04N21/234 , H04N21/44
摘要: 本公开涉及一种视频处理方法及装置、电子设备和存储介质,所述方法包括:根据查询文本段落的段落信息和视频库中多个视频的视频信息,确定多个视频中与查询文本段落相关联的预选视频;根据预选视频的视频帧信息和查询文本段落的语句信息,确定预选视频中的目标视频。根据本公开的实施例的视频处理方法,可通过视频与查询文本段落的相关性来检索视频,可精确查找目标视频,避免查询结果冗余,并可处理自然语言形式的查询文本段落,不会受到内容标签的固有内容的限制。
-
-
公开(公告)号:CN106796647B
公开(公告)日:2018-09-14
申请号:CN201480081759.5
申请日:2014-09-05
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06K9/00
摘要: 公开一种场景文本检测系统。该系统可包括最大稳定极值区域(MSER)检测器、经过训练的卷积神经网络(CNN)分类器、选择器和构造器。最大稳定极值区域(MSER)检测器可被配置成从图像中生成文本成分的集合,其中生成的文本成分排列成MSER树形结构。经过训练的卷积神经网络(CNN)分类器可被配置成将成分置信分数分配到文本成分的集合中的每个文本成分。选择器可被配置成从文本成分集合中选择具有所分配的成分置信分数中的较高成分置信分数的文本成分。构造器可被配置成使用所选择的文本成分来构造最终文本。也公开一种场景文本检测方法。
-
公开(公告)号:CN106937532B
公开(公告)日:2018-08-14
申请号:CN201480083106.0
申请日:2014-11-07
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06T17/00
CPC分类号: G06K9/00899 , G06K9/00201 , G06K9/00288
摘要: 本发明公开一种用于检测真正用户的系统。该系统可包括获取器、共面性确定器、构造器和检测器。获取器可接收主体(subject)的图像序列,该图像序列至少包括第一图像和第二图像,并且获取第一图像和第二图像的人脸关键点,形成人脸关键点的匹配对,在匹配对中,第一图像的每个人脸关键点与第二图像中的人脸关键点匹配。共面性确定器可基于人脸关键点的位置确定与人脸关键点的匹配对相关联的3D点是否共面。如果与人脸关键点相关联的3D点不共面,那么构造器可以从人脸关键点的位置来构造第一图像和第二图像的3D点云。检测器可基于构造的3D点云来检测主体是不是真正用户的真实人脸。
-
-
-
-
-
-
-
-
-