-
公开(公告)号:CN106156711A
公开(公告)日:2016-11-23
申请号:CN201510190211.0
申请日:2015-04-21
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
摘要: 本发明公开一种文本行的定位方法及装置,属于计算机视觉技术领域。该方法包括:提取待检测图像中各个像素的至少包括对称性特征向量的特征向量;根据每个像素的特征向量,确定多个潜在位于文本行对称轴上的目标像素,位于文本行对称轴上的像素具有对称性;对各个目标像素进行聚合,得到多个候选文本行区域;滤除非文本行区域得到文本行区域。由于待检测图像中的文本行区域通常具有对称性,因此,基于提取待检测图像中每个像素的对称性特征向量,能够从自然图像中直接定位到待检测图像中的文本行区域,而无需对各个候选字符区域进行组合以得到文本行区域,不仅方式简单,而且不依赖于自然图像中的连通区域,扩大了文本行定位方式的适用范围。
-
公开(公告)号:CN106156777A
公开(公告)日:2016-11-23
申请号:CN201510197323.9
申请日:2015-04-23
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06K9/46
摘要: 本发明公开了一种文本图片检测方法及装置,属于多媒体技术领域。所述方法包括:对于每一个待检测自然图片,在所述待检测自然图片中提取多个候选区域;计算每一个目标区域的类别响应,所述目标区域通过对所述多个候选区域进行过滤处理得到;根据每一个目标区域的类别响应,计算所述待检测自然图片的特征向量,所述特征向量的维数与所述类别响应的维数相等;当所述特征向量位于预先设置的文本图片归属的特征向量范围内时,确定所述待检测自然图片为文本图片。由于上述文本图片检测方式可对自然图片中的文本图片进行检测,所以该种检测方式的应用范围较为广泛,普适性强。
-
公开(公告)号:CN106156711B
公开(公告)日:2020-06-30
申请号:CN201510190211.0
申请日:2015-04-21
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
摘要: 本发明公开一种文本行的定位方法及装置,属于计算机视觉技术领域。该方法包括:提取待检测图像中各个像素的至少包括对称性特征向量的特征向量;根据每个像素的特征向量,确定多个潜在位于文本行对称轴上的目标像素,位于文本行对称轴上的像素具有对称性;对各个目标像素进行聚合,得到多个候选文本行区域;滤除非文本行区域得到文本行区域。由于待检测图像中的文本行区域通常具有对称性,因此,基于提取待检测图像中每个像素的对称性特征向量,能够从自然图像中直接定位到待检测图像中的文本行区域,而无需对各个候选字符区域进行组合以得到文本行区域,不仅方式简单,而且不依赖于自然图像中的连通区域,扩大了文本行定位方式的适用范围。
-
公开(公告)号:CN106156777B
公开(公告)日:2020-06-02
申请号:CN201510197323.9
申请日:2015-04-23
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06K9/46
摘要: 本发明公开了一种文本图片检测方法及装置,属于多媒体技术领域。所述方法包括:对于每一个待检测自然图片,在所述待检测自然图片中提取多个候选区域;计算每一个目标区域的类别响应,所述目标区域通过对所述多个候选区域进行过滤处理得到;根据每一个目标区域的类别响应,计算所述待检测自然图片的特征向量,所述特征向量的维数与所述类别响应的维数相等;当所述特征向量位于预先设置的文本图片归属的特征向量范围内时,确定所述待检测自然图片为文本图片。由于上述文本图片检测方式可对自然图片中的文本图片进行检测,所以该种检测方式的应用范围较为广泛,普适性强。
-
公开(公告)号:CN113516143B
公开(公告)日:2024-08-27
申请号:CN202011350030.7
申请日:2020-11-26
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V10/75 , G06V10/40 , G06V10/82 , G06N3/0464
摘要: 本申请是关于一种文本图像匹配方法、装置、计算机设备及存储介质,属于图像处理技术领域。该方法包括:获取第一特征以及第二特征;第一特征是由第一文本包含的至少两种尺度的文本特征经过编码得到的;第二特征是由第一图像包含的至少两种尺度的图像特征经过编码得到的,获取第一特征与第二特征之间的第一特征相似度;基于第一特征相似度,对第一特征以及第二特征进行加权,获得第一加权特征以及第二加权特征;基于第一特征、第二特征、第一加权特征以及第二加权特征,获取第一文本与第一图像的第二特征相似度;基于第二特征相似度,获取匹配信息。通过上述方案,提高了文本图像特征匹配的准确度。
-
公开(公告)号:CN112052771B
公开(公告)日:2024-08-27
申请号:CN202010896120.X
申请日:2020-08-31
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/10 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开一种对象重识别方法及装置;本申请与人工智能的计算机视觉以及云技术领域相关,可以获取目标区域内多个对象样本图像和每一对象样本图像的样本标签和时空信息;根据多个对象样本图像构建无向图,无向图包括相互连接的图像节点,图像节点包括对象样本图像的图像特征;基于目标区域内的时空概率分布、以及多个对象样本图像的图像特征和时空信息,确定无向图中相邻图像节点之间的时空转移概率和图像相似度;基于神经网络模型、时空转移概率、图像相似度以及多个对象样本图像的图像特征和样本标签,对神经网络模型的网络参数进行调整,以通过训练后的神经网络模型对多个待识别对象图像进行对象重识别;本申请能提升对象重识别的准确率。
-
公开(公告)号:CN111507253B
公开(公告)日:2023-06-30
申请号:CN202010300775.6
申请日:2020-04-16
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V20/40 , G06V10/44 , G06V10/56 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明提供了一种基于人工智能的陈列物品审核方法、装置、电子设备及计算机可读存储介质;方法包括:确定待识别图片包括的多个陈列场景候选区域,并提取每个陈列场景候选区域的图像特征;基于每个陈列场景候选区域的图像特征,从每个陈列场景候选区域中识别出陈列场景的类型和陈列场景的位置;基于陈列场景的位置所对应的区域的图像特征,进行与陈列场景的类型对应的物品识别处理,以确定陈列场景中陈列的物品的类型以及物品的位置;基于陈列场景中物品的类型和位置执行审核操作,得到陈列场景的审核结果。通过本发明,能够准确的识别出图片中的物品,从而能够自动化地对识别出来的物品进行审核。
-
公开(公告)号:CN108197326B
公开(公告)日:2023-05-26
申请号:CN201810119550.3
申请日:2018-02-06
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/583 , G06F18/22 , G06N3/0464
摘要: 本公开揭示了一种车辆检索方法及装置、电子设备、计算机可读存储介质,该方案包括:获取待检索车辆图像;通过卷积神经网络进行待检索车辆图像的特征提取,获得特征向量;对特征向量分别进行属性特征提取和相对正负样本之间深度特征的提取;合并属性特征和深度特征,获得待检索车辆图像的车辆视觉特征;进行车辆检索数据库中图像与待检索车辆图像之间车辆视觉特征的匹配计算,获得与待检索车辆图像匹配的目标图像。本发明提供的技术方案,车辆检索的准确性更高,由于无需人工参与查询,车辆检索效率高。
-
公开(公告)号:CN110348428B
公开(公告)日:2023-03-24
申请号:CN201910690067.5
申请日:2017-11-01
申请人: 腾讯科技(深圳)有限公司 , 腾讯云计算(北京)有限责任公司
IPC分类号: G06V40/18 , G06V10/764 , G06N3/0464 , G06N3/084
摘要: 本发明实施例提供一种眼底图像分类方法、装置及计算机可读存储介质,包括:获得眼底图像、以及所述眼底图像中所包括的对象的类别;调整所述眼底图像的显示参数满足取值条件;根据所述显示参数的分布需要满足的分布条件,对所述眼底图像的所述显示参数进行变换获得新图像;基于调整后的眼底图像和新图像构造的训练集、以及所包括对象的类别,训练神经网络模型;基于训练后的所述神经网络模型,判断待预测眼底图像中所包括对象的类别。
-
公开(公告)号:CN109753978B
公开(公告)日:2023-02-17
申请号:CN201711060208.2
申请日:2017-11-01
申请人: 腾讯科技(深圳)有限公司 , 腾讯云计算(北京)有限责任公司
IPC分类号: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
摘要: 本申请实施例提供一种图像分类方法、装置以及计算机可读存储介质,包括:获得原始图像、以及所述原始图像中所包括的对象的类别;调整所述原始图像的显示参数满足取值条件;根据所述显示参数的分布需要满足的分布条件,对所述原始图像的所述显示参数进行变换获得新图像;基于调整后的原始图像和所述新图像进行组合构造的训练集、以及所包括对象的类别,训练神经网络模型;基于训练后的所述神经网络模型,将待预测图像和标注有对象的类别的参考图像输入所述神经网络模型,判断所述待预测图像中所包括对象的类别。
-
-
-
-
-
-
-
-
-