识别原始字符集的字符的方法与系统

    公开(公告)号:CN102279926B

    公开(公告)日:2016-05-18

    申请号:CN201110165719.7

    申请日:2011-06-09

    CPC classification number: G06K9/3283 G06K2209/01

    Abstract: 将图像纠偏系统和技术用于光学字符识别的上下文中。获取以原始线性(水平)定向的原始字符集的图像。相对于该原始线性定向偏斜一旋转角的所获取的字符集由该图像的像素表示。估计该旋转角,且可以将置信度值与该估计关联起来,以便判断是否纠偏该图像。结合旋转角估计,将边缘检测滤波器应用于所获取的字符集以便产生边缘图,将该边缘图输入到线性霍夫变换滤波器以便以参数形式产生一组输出线。给各输出线分配分数,且基于各分数将具有接近旋转角的斜率的至少一个输出线判断为主导线。

    经历OCR过程的文本的单词识别

    公开(公告)号:CN102236800B

    公开(公告)日:2015-12-02

    申请号:CN201110117322.0

    申请日:2011-04-29

    CPC classification number: G06K9/344 G06K2209/01

    Abstract: 本发明公开了经历OCR过程的文本的单词识别。一种用于在经历光学字符识别的文本图像中标识单词的方法包括,接收(410)包括已由多个切分线分割的文本行的图像(15)的位图(多个切分线各自与反映相应的切分线正确地将文本行分割成个体字符的程度的置信水平相关联)。至少部分基于文本行以及具有大于第一阈值的切分线置信水平的第一子集的切分线,来在文本行的一个中标识(420)一个或多个单词。如果(430)第一单词不与足够高的单词置信水平相关联,则至少部分基于具有大于小于第一阈值的第二阈值的置信水平的第二子集的切分线,来标识(440)至少一第二单词。

    在OCR过程中将词语位图分割为单个字符或字形

    公开(公告)号:CN102870399B

    公开(公告)日:2015-09-02

    申请号:CN201180023323.7

    申请日:2011-04-28

    CPC classification number: G06K9/342 G06K2209/01

    Abstract: 提供一种图像处理装置,包括在进行OCR处理的文本图像的位图中将词语分割为单个字符的字符截断器组件。字符截断器组件被配置为产生(可能是弯曲的)截断线的集合,所述截断线将任何给定的词语的位图分为其单个字符或字形候选。当输入的位图包含两个独立的词语,这种情况可以通过标记这些词语应当被拆分的位置来处理。通过考虑在给定的词语位图中的字形和背景颜色,字符分割算法计算垂直方向的、弯曲的截断线的集合。随后为了保存那些确实分隔了词语的字形的线以及将那些没有分隔词语的字形的线的数目减到最少,使用各种试探法过滤所述集合。

Patent Agency Ranking