一种基于旋转敏感特征的文本回归检测方法

    公开(公告)号:CN108427924B

    公开(公告)日:2020-06-23

    申请号:CN201810195630.7

    申请日:2018-03-09

    IPC分类号: G06K9/00 G06K9/32 G06N3/04

    摘要: 本发明公开了一种基于旋转敏感特征的文本回归检测方法,通过方向响应卷积网络得到旋转敏感特征,用于包围盒的回归任务,得到包围盒的位置信息;然后,通过方向响应池化,将旋转敏感特征转化为旋转不变特征,用于包围盒的分类任务,得到包围盒是否属于文本的类别信息;最后,仅需简单后处理即可得到检测结果。该方法对于分类和回归区分设计的特征能适应自然场景图片里任意变化角度的文本,并且可以端到端训练,这种将分类和回归不共享特征的方法也可以应用到一般物体检测的框架中。本发明提出的检测方法相对于现有技术思路新颖,在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。

    一种基于旋转敏感特征的文本回归检测方法

    公开(公告)号:CN108427924A

    公开(公告)日:2018-08-21

    申请号:CN201810195630.7

    申请日:2018-03-09

    IPC分类号: G06K9/00 G06K9/32 G06N3/04

    摘要: 本发明公开了一种基于旋转敏感特征的文本回归检测方法,通过方向响应卷积网络得到旋转敏感特征,用于包围盒的回归任务,得到包围盒的位置信息;然后,通过方向响应池化,将旋转敏感特征转化为旋转不变特征,用于包围盒的分类任务,得到包围盒是否属于文本的类别信息;最后,仅需简单后处理即可得到检测结果。该方法对于分类和回归区分设计的特征能适应自然场景图片里任意变化角度的文本,并且可以端到端训练,这种将分类和回归不共享特征的方法也可以应用到一般物体检测的框架中。本发明提出的检测方法相对于现有技术思路新颖,在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。

    一种训练模型以及字符检测的方法及装置

    公开(公告)号:CN113205095A

    公开(公告)日:2021-08-03

    申请号:CN202110392490.4

    申请日:2021-04-13

    IPC分类号: G06K9/34 G06K9/62

    摘要: 本说明书公开了一种训练模型以及字符检测的方法及装置。基于合成训练样本对标注模型进行训练,根据训练后的标注模型的输出对真实训练样本进行标注,并根据合成训练样本对字符检测模型进行训练。通过训练后的字符检测模型对待检测的图像进行特征提取,并确定该图像中各字符的包围框以及该图像中的各中心线。以及根据各中心线与各包围框的重叠程度、与同一中心线重叠的各包围框,确定包围框组,并根据各包围框组中各包围框的几何位置特征,对各中心线向周围进行膨胀得到各膨胀包围框,作为该图像的字符检测结果。可通过训练得到的字符检测模型输出准确的包围框以及中心线,以确定出准确的膨胀包围框,作为字符检测结果。

    一种基于全卷积网络的多方向场景文本单次检测方法

    公开(公告)号:CN107977620A

    公开(公告)日:2018-05-01

    申请号:CN201711225391.7

    申请日:2017-11-29

    IPC分类号: G06K9/00 G06K9/32 G06K9/62

    摘要: 本发明公开了一种基于全卷积网络的多方向场景文本单次检测方法,通过构建全卷积的单次检测网络模型,无须多步处理步骤、仅用单个网络就可以进行端到端训练,以多种尺度的特征提取层结合文本框预测层可以检测到不同尺寸、长宽比、分辨率的多方向自然场景文字,并且能以多边形包围盒贴合文字从而更少地引入背景干扰,最后仅需简单的非最大值抑制操作便可获得最终的文本检测结果。本发明提出的检测方法相对于现有技术结构简单有效,在准确度、检测速度和鲁棒性这些方面都取得了卓越的效果,有很强的实际应用价值。

    一种基于可微分二值化的实时文本检测方法

    公开(公告)号:CN110781967B

    公开(公告)日:2022-08-19

    申请号:CN201911038562.4

    申请日:2019-10-29

    摘要: 本发明公开了一种基于可微分二值化的实时文本检测方法。通过对图像进行分割,得到文本区域的概率图,对概率图采用可微分二值化得到二值图,在二值图上寻找联通区域即可得到文本区域的包围盒。本方法通过给概率图和二值图均施加监督,将二值化的过程纳入训练之中,提升检测效果。本发明相对于现有文本检测方法,在准确度、运行效率和通用性方面都取得了卓越效果,有很强的实际应用价值。

    一种基于可微分二值化的实时文本检测方法

    公开(公告)号:CN110781967A

    公开(公告)日:2020-02-11

    申请号:CN201911038562.4

    申请日:2019-10-29

    摘要: 本发明公开了一种基于可微分二值化的实时文本检测方法。通过对图像进行分割,得到文本区域的概率图,对概率图采用可微分二值化得到二值图,在二值图上寻找联通区域即可得到文本区域的包围盒。本方法通过给概率图和二值图均施加监督,将二值化的过程纳入训练之中,提升检测效果。本发明相对于现有文本检测方法,在准确度、运行效率和通用性方面都取得了卓越效果,有很强的实际应用价值。

    一种任意形状的场景文本端到端识别方法

    公开(公告)号:CN108549893A

    公开(公告)日:2018-09-18

    申请号:CN201810294058.X

    申请日:2018-04-04

    摘要: 本发明公开了一种任意形状的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过快速区域分类回归分支调整候选文本框位置得到更准确的文本包围盒位置信息;其次将包围盒位置信息输入分割分支,通过像素投票算法得到预测字符序列;最后通过加权编辑距离算法对预测的字符序列进行处理,找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。本发明提出的检测识别方法相对于现有技术在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。

    一种基于全卷积网络的多方向场景文本单次检测方法

    公开(公告)号:CN107977620B

    公开(公告)日:2020-05-19

    申请号:CN201711225391.7

    申请日:2017-11-29

    IPC分类号: G06K9/00 G06K9/32 G06K9/62

    摘要: 本发明公开了一种基于全卷积网络的多方向场景文本单次检测方法,通过构建全卷积的单次检测网络模型,无须多步处理步骤、仅用单个网络就可以进行端到端训练,以多种尺度的特征提取层结合文本框预测层可以检测到不同尺寸、长宽比、分辨率的多方向自然场景文字,并且能以多边形包围盒贴合文字从而更少地引入背景干扰,最后仅需简单的非最大值抑制操作便可获得最终的文本检测结果。本发明提出的检测方法相对于现有技术结构简单有效,在准确度、检测速度和鲁棒性这些方面都取得了卓越的效果,有很强的实际应用价值。

    一种任意形状的场景文本端到端识别方法

    公开(公告)号:CN108549893B

    公开(公告)日:2020-03-31

    申请号:CN201810294058.X

    申请日:2018-04-04

    摘要: 本发明公开了一种任意形状的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过快速区域分类回归分支调整候选文本框位置得到更准确的文本包围盒位置信息;其次将包围盒位置信息输入分割分支,通过像素投票算法得到预测字符序列;最后通过加权编辑距离算法对预测的字符序列进行处理,找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。本发明提出的检测识别方法相对于现有技术在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。