-
公开(公告)号:CN111506758B
公开(公告)日:2024-05-03
申请号:CN202010299942.X
申请日:2020-04-16
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/58 , G06F16/55 , G06F40/284
摘要: 本申请实施例公开了一种物品名称确定方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取包含目标物品的第一图像,从数据库中选取与第一图像相似的多个参考图像,对多个参考图像对应的物品文本信息进行分词处理,得到多个词语,从多个词语中提取满足预设条件的关键词语,确定为目标物品的物品名称。通过确定与第一图像相似的多个参考图像,提高了获取到的物品文本信息的准确性,从获取到的物品文本信息中提取满足预设条件关键词语,提高了得到的关键词语的准确性,从而提高了确定的物品名称的准确性。
-
公开(公告)号:CN107665324B
公开(公告)日:2020-08-28
申请号:CN201610604477.X
申请日:2016-07-27
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06K7/14
摘要: 本发明实施例公开了一种图像识别方法及终端,用于解决现有图像识别中存在局限性的问题,不仅可以识别出任意形状的一维码,还可以识别一维码以外的其他编码图像,从而有效提高识别图像的广泛性以及可靠性,无需对图像进行形态学操作和连通域分析,有效提高识别图像的速率。本发明实施例方法包括:获取目标图像的第一图像特征;根据所述第一图像特征确定所述目标图像的目标区域;通过过滤所述目标区域对应的图像确定所述目标图像的目标子区域;获取所述目标子区域对应的图像的第二图像特征;根据所述第二图像特征识别出所述目标子区域对应的图像的编码类型,其中,所述编码类型包括一维码,二维码或者无码中的至少一种类型。
-
公开(公告)号:CN110163910A
公开(公告)日:2019-08-23
申请号:CN201910222521.4
申请日:2019-03-22
申请人: 腾讯科技(深圳)有限公司
发明人: 姜媚
摘要: 本申请涉及一种物体对象定位方法、装置、计算机设备和存储介质,获取待处理图像;提取所述待处理图像的图像特征;基于所述图像特征对所述待处理图像的每个像素点进行预设分类映射,得到各所述像素点的区域概率;所述区域概率包括所述像素点属于对象区域的概率;根据所述像素点的所述区域概率,分别确定各所述像素点的所属区域;对所述所属区域为所述对象区域的各所述像素点进行连通域提取,确定所述待处理图像中的所述对象区域。如此,通过像素级的分类解决物体对象的定位问题,能够提高物体对象定位的准确性。同时,具有较强的泛化性和鲁棒性。
-
公开(公告)号:CN104023249B
公开(公告)日:2015-10-21
申请号:CN201410262126.6
申请日:2014-06-12
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N21/235 , H04N21/435
CPC分类号: H04N21/482 , H04N21/41407 , H04N21/43637 , H04N21/44008 , H04N21/8146
摘要: 本发明提供了一种电视频道识别方法,所述方法包括:获取电视视频图像;将所述电视视频图像对应台标模板库中的每个台标模板,进行所述电视视频图像的台标特征提取;将对应每个台标模板所提取的电视视频图像的台标特征与对应的台标模板中的特征进行匹配;将匹配程度最高的台标模板对应的电视频道作为识别结果。采用该方法,能提高电视频道识别精度。此外,还提供了一种电视频道识别装置。
-
公开(公告)号:CN114596566A
公开(公告)日:2022-06-07
申请号:CN202210402933.8
申请日:2022-04-18
申请人: 腾讯科技(深圳)有限公司
发明人: 姜媚
IPC分类号: G06V30/19 , G06V10/22 , G06V10/24 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06F40/263
摘要: 本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供一种文本识别方法及相关装置,用以提高文本识别准确率,该方法包括:将待识别图像输入至目标分类模型中,获得语种分布信息和原始文本呈现方向,然后,基于原始文本呈现方向,对待识别图像进行图像矫正,获得目标识别图像,之后,确定多个语种各自对应的文本区域图像集,最后,基于各文本区域图像集,分别采用对应语种关联的目标文本识别模型,得到文本识别结果。这样,通过对语种分布信息和文本呈现方向进行准确判断和预测,提高了文本识别精度。
-
公开(公告)号:CN110163193A
公开(公告)日:2019-08-23
申请号:CN201910228327.7
申请日:2019-03-25
申请人: 腾讯科技(深圳)有限公司
发明人: 姜媚
摘要: 本申请涉及一种图像处理方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取待处理图像;将所述待处理图像输入图像处理模型进行证件角点特征提取;通过所述图像处理模型对所提取的证件角点特征进行处理,生成与所述待处理图像对应的角点位置预测特征图;所述角点位置预测特征图中的像素点,具有表示属于证件角点的概率的像素值,且与所述待处理图像中的像素点对应;根据所述角点位置预测特征图,确定所述待处理图像中的角点位置;在所述待处理图像中,基于所述角点位置定位证件图像区域。本申请提供的方案可以提高证件区域划分的准确性。
-
公开(公告)号:CN109409161A
公开(公告)日:2019-03-01
申请号:CN201811231652.0
申请日:2018-10-22
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06K7/14
摘要: 本申请公开了一种图形码识别方法、装置、终端及存储介质,属于图形码识别领域。所述方法包括:显示目标图像,目标图像中包含至少两个图形码;当接收到对目标图像的图形码识别操作时,获取目标图像中各个图形码的图形码位置信息;根据图形码位置信息,确定图形码识别操作指示的目标图形码;显示目标图形码对应的目标图形码识别结果。本申请实施例中,借助图形码位置识别机制,终端能够同时识别出同一图像中的多个图形码,从而根据各个图形码各自的位置确定出符合用户识别意图的目标图形码,进而返回目标图形码的识别结果,解决了相关技术中,当图像中包含至少两个图形码时,图形码识别效率较低的问题。
-
公开(公告)号:CN108898087A
公开(公告)日:2018-11-27
申请号:CN201810650499.9
申请日:2018-06-22
申请人: 腾讯科技(深圳)有限公司
发明人: 姜媚
摘要: 本申请实施例公开了一种人脸关键点定位模型的训练方法、装置、设备及存储介质。所述方法包括:构建用于人脸关键点定位的CNN模型,CNN模型的卷积层数量大于第一阈值,且卷积层的通道数小于第二阈值;采用CNN模型对训练样本进行人脸关键点定位,得到人脸关键点的预测位置;其中,人脸关键点包括n种分类,n为大于1的整数;分别每一种分类的人脸关键点的预测位置和真实位置,计算n种分类各自对应的损失函数值,进而计算CNN模型的损失函数值;当CNN模型的损失函数值小于预设阈值时,停止对CNN模型的训练并保存。本申请实施例通过构建瘦长型的CNN模型,在尽可能保证定位精度不受损失的前提下,减小模型体积。
-
公开(公告)号:CN104023249A
公开(公告)日:2014-09-03
申请号:CN201410262126.6
申请日:2014-06-12
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N21/235 , H04N21/435
CPC分类号: H04N21/482 , H04N21/41407 , H04N21/43637 , H04N21/44008 , H04N21/8146
摘要: 本发明提供了一种电视频道识别方法,所述方法包括:获取电视视频图像;将所述电视视频图像对应台标模板库中的每个台标模板,进行所述电视视频图像的台标特征提取;将对应每个台标模板所提取的电视视频图像的台标特征与对应的台标模板中的特征进行匹配;将匹配程度最高的台标模板对应的电视频道作为识别结果。采用该方法,能提高电视频道识别精度。此外,还提供了一种电视频道识别装置。
-
公开(公告)号:CN110163197B
公开(公告)日:2023-03-10
申请号:CN201810974541.2
申请日:2018-08-24
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V10/40 , G06V10/22 , G06V10/82 , G06V10/766 , G06N3/0464 , G06N3/08
摘要: 本申请涉及一种目标检测方法、装置、存储介质及计算机设备,方法包括:获取待测图像;提取所述待测图像对应的第一图像特征和第二图像特征;根据所述第二图像特征进行空洞卷积,得到所述待测图像对应的第三图像特征;根据所述第一图像特征和所述第三图像特征进行分类及回归,确定所述待测图像中的目标对象所对应的候选位置参数以及与所述候选位置参数对应的置信度;按照所述置信度从各所述候选位置参数中筛选出有效位置参数,并根据所述有效位置参数确定所述待测图像中目标对象所在的位置。本申请中的方案能够提高目标检测的鲁棒性及减少耗时。
-
-
-
-
-
-
-
-
-