多源图文信息分类方法及其相应的装置、设备、介质

    公开(公告)号:CN113449808B

    公开(公告)日:2022-06-21

    申请号:CN202110790695.8

    申请日:2021-07-13

    IPC分类号: G06K9/62 G06V10/764

    摘要: 本申请公开一种多源图文信息分类方法及其相应的装置、设备、介质,该方法包括:获取待分类图片及待分类文本,待分类文本包含待分类图片的描述信息;先后融合从待分类图片的第一图样、第二图样中提取的图像特征信息与从待分类文本提取的文本特征信息获得图文特征信息,对该图文特征信息进行分类,相应获得预设分类结构所派生的各分类的第一、第二评分值,其中所述第一图样为该待分类图片的原图,所述第二图样为该待分类图片被以预设细粒度切分后乱序拼接而成的副图;最后融合所述第一评分值和第二评分值获得综合评分值,输出所述综合评分值最大的分类所对应的分类标签。本申请可以获得高准确度的分类结果,特别适用于电商应用场景中。

    目标物品识别方法及其装置、设备、介质、产品

    公开(公告)号:CN113869388A

    公开(公告)日:2021-12-31

    申请号:CN202111120489.2

    申请日:2021-09-24

    发明人: 刘涛 兴百桥

    IPC分类号: G06K9/62 G06T7/12

    摘要: 本申请公开一种目标物品识别方法及其装置、设备、介质、产品,所述方法包括:获取待识别是否包含目标物品的物品图片;物品图片进行多个尺度的编解码,获得捕捉到其中物品轮廓特征的多个图像特征信息,根据所述多个图像特征信息从物品图片中提取出物品分割图;分别对各个图像特征信息进行分类,获得图像特征信息包含所述目标物品的分类概率,求取所有图像特征信息分类获得的多个分类概率的平均概率;对物品分割图进行图像识别,获得所述物品分割图包含所述目标物品的识别概率;融合平均概率与识别概率获得融合概率进行结果判断,当所述融合概率大于预设阈值时,判定所述物品图片包含目标物品。本申请能够更准确地从物品图片中识别出目标物品。

    文本公式的定位方法、模型训练方法及相关装置

    公开(公告)号:CN112101359B

    公开(公告)日:2021-02-12

    申请号:CN202011251708.6

    申请日:2020-11-11

    摘要: 本申请提供了一种文本公式的定位方法、模型训练方法及相关装置,定位方法包括获取待识别图像,将待识别图像输入至文本公式定位模型,分别定位出待识别图像的文本区域和/或公式区域;文本公式定位模型是采用标记有文本公式定位信息的图像样本对改进的Mask‑RCNN网络进行训练得到的,改进的Mask‑RCNN网络包括Attention‑FPN网络,Attention‑FPN网络是在FPN网络的自上而下连接结构和横向连接结构中加入注意力模块而形成的。该方法由于采用了文本公式定位模型,识别效率以及准确率高,并且可以同时定位出公式区域和文字区域,大大减少了操作。

    文本安全类型检测方法及其装置、设备、介质、产品

    公开(公告)号:CN114049319A

    公开(公告)日:2022-02-15

    申请号:CN202111299408.X

    申请日:2021-11-04

    发明人: 兴百桥

    摘要: 本申请公开一种文本安全类型检测方法及其装置、设备、介质、产品,所述方法包括:获取待检测的广告图片;采用边缘增强网层对待检测的广告图片进行多图像方向的边缘增强处理,获得相应多个边缘增强图片;针对所述广告图片和边缘增强图片进行文本对象检测,确定其中属于文本对象的候选框及各候选框相对应置信度信息;将所述候选框进行非极大值抑制处理,消除冗余的候选框信息,提高文本安全检测系统的工作效率,其后针对剩余候选框相对应的文本对象进行文本识别,根据识别出的文本判别出其相应的安全类型。本申请能对构成上述模型训练集的相关图片、文本数据进行高效的筛选,以便用于训练相关模型,使模型判别更精准,具有广泛适应性。

    文本识别方法、装置、存储介质、计算机设备

    公开(公告)号:CN112508102A

    公开(公告)日:2021-03-16

    申请号:CN202011434696.0

    申请日:2020-12-10

    IPC分类号: G06K9/62 G06F40/126 G06N3/04

    摘要: 本发明提供的一种文本识别方法、装置、存储介质、计算机设备,在将待识别图像输入至识别模型中得到多个原始字符序列后,利用原始字符序列中识别概率第二的字符替换识别概率第一的字符,从而得到多个中间字符序列,若识别概率最大的原始字符序列为正确的,则中间字符序列中可能存在多种错误类型的序列;若识别概率最大的原始字符序列是错误的,则可以通过中间字符序列进行修正,然后将待修正的字符序列、中间字符序列以及识别概率最大的原始字符序列作为最终的识别结果序列,这样得到的识别结果序列中既包含了正确的序列,又包含了错误的序列,无论后续采取怎样的判题策略,都能够准确进行判题,且该识别过程较为简便,极大地提高了工作效率。

    小目标检测方法及其装置、设备、介质、产品

    公开(公告)号:CN114332586A

    公开(公告)日:2022-04-12

    申请号:CN202111591509.4

    申请日:2021-12-23

    发明人: 兴百桥

    摘要: 本申请公开一种小目标检测方法及其装置、设备、介质、产品,所述方法包括:获取待检测的广告图片;采用已训练至收敛的目标检测模型对所述广告图片进行目标检测,根据检测结果截取所述广告图片中的目标区域图像;接着采用已训练至收敛的、添加了可抑制弱神经元的分类头的图像识别模型针对所述广告图片及所述目标区域图像分别进行图像识别,获得相应的识别结果组合构成小目标识别序列;最后辨识实例应用场景的实际需求,根据所述实际需求从所述小目标识别序列中获取最终概率值,进行最终判别,输出结果。本申请能对构成上述模型训练集的相关图片进行高效筛选和数据增强,以便用于训练相关模型,使相关模型更精准,具有广泛适应性。

    商标图样匹配方法及其相应的装置、设备、介质

    公开(公告)号:CN113569933A

    公开(公告)日:2021-10-29

    申请号:CN202110813874.9

    申请日:2021-07-19

    IPC分类号: G06K9/62 G06N3/08

    摘要: 本申请公开一种商标图样匹配方法及其相应的装置、设备、介质,该方法包括:获取待比图片所包含的商标图样的图像特征,构造待比特征矩阵,其中每个行向量存储单个所述商标图样的图像特征;获取预设的被比商标库的被比特征矩阵,其中每个行向量存储被比商标库中单个被比商标的图像特征;基于待比特征矩阵与被比特征矩阵计算相似度,获得相似矩阵;从相似矩阵中筛选出相似度满足预设条件的元素以从所述商标图样中确定与被比商标存在相似度关联的疑似商标图样,为每个疑似商标图样匹配出与其最相似的前若干个被比商标。本申请基于矩阵操作实现对商标近似匹配的运算和判决,运算效率高,响应迅速,开销较小,适于从产品图片中识别出疑似商标侵权信息。

    图像属性的确定方法、装置、终端设备和存储介质

    公开(公告)号:CN112287847A

    公开(公告)日:2021-01-29

    申请号:CN202011194935.X

    申请日:2020-10-30

    IPC分类号: G06K9/00 G06K9/62 G06N3/04

    摘要: 本申请提供了一种图像属性的确定方法、终端设备和存储介质,其方法包括获取待识别图像;将待识别图像输入至预先训练的图像属性分类模型,分别输出待识别图像的图像角度概率值和文字类型概率值;图像属性分类模型是采用标记有图像角度信息和文字类型信息的图像样本对改进的Efficient网络进行训练得到的,改进的Efficient网络包括多个Attention‑MBConv模块,Attention‑MBConv模块是在MBConv模块的最后一个特征输出层之后加入注意力模块而形成的;根据图像角度概率值和文字类型概率值分别确定图像角度和文字类型;该方法可同时识别出图像角度和文字类型,减少了操作以及计算量。

    文本识别方法、装置、存储介质、计算机设备

    公开(公告)号:CN112508102B

    公开(公告)日:2024-08-20

    申请号:CN202011434696.0

    申请日:2020-12-10

    摘要: 本发明提供的一种文本识别方法、装置、存储介质、计算机设备,在将待识别图像输入至识别模型中得到多个原始字符序列后,利用原始字符序列中识别概率第二的字符替换识别概率第一的字符,从而得到多个中间字符序列,若识别概率最大的原始字符序列为正确的,则中间字符序列中可能存在多种错误类型的序列;若识别概率最大的原始字符序列是错误的,则可以通过中间字符序列进行修正,然后将待修正的字符序列、中间字符序列以及识别概率最大的原始字符序列作为最终的识别结果序列,这样得到的识别结果序列中既包含了正确的序列,又包含了错误的序列,无论后续采取怎样的判题策略,都能够准确进行判题,且该识别过程较为简便,极大地提高了工作效率。

    目标检测方法及其装置、设备、介质、产品

    公开(公告)号:CN114283281A

    公开(公告)日:2022-04-05

    申请号:CN202111591555.4

    申请日:2021-12-23

    发明人: 兴百桥

    摘要: 本申请公开一种目标检测方法及其装置、设备、介质、产品,所述方法包括:获取待检测的广告图片;采用已训练至收敛的目标检测模型对所述广告图片进行目标检测,根据检测结果截取所述广告图片中的目标区域图像;接着采用已训练至收敛的图像识别模型针对所述广告图片及所述目标区域图像分别进行图像识别,获得相应的识别结果组合构成目标识别序列;最后辨识实例应用场景的实际需求,根据所述实际需求从所述目标识别序列中获取预设条件下的概率值作为广告图片是否包含目标物品的最终概率值,进行最终判别,输出结果。本申请能对构成上述模型训练集的相关图片进行高效筛选和数据增强,以便用于训练相关模型,使相关模型更精准,具有广泛适应性。