用于退化文字行的字符识别装置和方法

    公开(公告)号:CN100409251C

    公开(公告)日:2008-08-06

    申请号:CN200510093529.3

    申请日:2005-08-26

    Abstract: 用于退化文字行的字符识别装置和方法。该字符识别装置包括:特征提取单元,利用第一字典从所输入的归一化图像中提取特征;粗分类单元,通过将所提取的特征与存储在第二字典中的特征进行比较,来选择特定数量的字符候选类别;特征重构单元,通过使用第三字典以及所选择的特定数量的字符候选类别来重构数量为该特定数量的重构特征;精细识别单元,根据由该特征提取单元提取的特征与该重构特征来识别并输出最终的识别字符编码;图像重构单元,通过使用该第一字典以及由该特征重构单元生成的重构特征来重构数量为该特定数量的重构图像;识别距离计算单元,用于根据所输入的归一化图像和该图像重构单元生成的重构图像来计算并输出识别距离。

    建立劣化字典的方法和装置

    公开(公告)号:CN100373399C

    公开(公告)日:2008-03-05

    申请号:CN200410058588.2

    申请日:2004-08-18

    CPC classification number: G06K9/6255

    Abstract: 本发明提供了一种自动建立劣化字典的装置和方法。其中,劣化模式生成模块根据不同的劣化参数,由原始字符图像生成多个劣化模式;劣化字典生成模块在这多个劣化模式的基础上建立与多个劣化参数对应的多个劣化字典;最后字典匹配模块根据测试样本组合,确定与该测试样本组合的劣化水平最为匹配的字典作为最终的劣化字典。在本发明中,通过简单的缩放处理和模糊处理来生成不同的劣化模式,由此建立劣化字典。因此,本发明可以简单容易地实现。本发明的方法和装置不仅可以用于字符识别领域,也可以用于语音识别和面容识别等其它领域。

    灰度字符的精确分割装置及方法

    公开(公告)号:CN100369049C

    公开(公告)日:2008-02-13

    申请号:CN200510008512.3

    申请日:2005-02-18

    CPC classification number: G06K9/346 G06K9/00463 G06K2209/01

    Abstract: 灰度字符精确分割装置及方法。灰度字符精确分割装置包括:调整分割单元,用于对输入的经粗略分割的低分辨率文本行图像进行调整分割,从而产生经调整的字符图像;字符图像二值化单元,用于根据输入于其中的字符图像生成二值字符图像;消噪单元,用于消除所述二值化单元生成的二值字符图像中的噪声信息;最终字符图像分割单元,用于从被消除了噪声的所述二值字符图像中产生精确分割的字符图像。

    布局分析程序、布局分析设备和布局分析方法

    公开(公告)号:CN1987895A

    公开(公告)日:2007-06-27

    申请号:CN200610074795.6

    申请日:2006-04-14

    CPC classification number: G06K9/00463

    Abstract: 布局分析程序、布局分析设备和布局分析方法。能够高度准确地从图像(如果该图像为彩色图像)中提取文本块的布局分析程序、布局分析设备、布局分析方法和介质。布局分析程序使得计算机执行:分割区域提取步骤,根据二值图像提取通过图案划分的区域,以使用该提取结果作为分割区域;字符要素集合提取步骤,针对各分割区域,对通过第一二值图像布局分析处理提取的字符要素集合进行提取,以使用该提取结果作为字符要素集合;文本块提取步骤,在各分割区域中提取包含有所提取的字符要素集合的区域,以避免与第二二值图像布局处理所提取的非字符要素交叠,并使用该提取结果作为文本块;以及布局信息生成步骤,根据所述文本块以及第二二值图像布局分析处理所提取的非字符要素,生成布局信息。

    用于退化文字行的字符识别装置和方法

    公开(公告)号:CN1920855A

    公开(公告)日:2007-02-28

    申请号:CN200510093529.3

    申请日:2005-08-26

    Abstract: 用于退化文字行的字符识别装置和方法。该字符识别装置包括:特征提取单元,利用第一字典从所输入的归一化图像中提取特征;粗分类单元,通过将所提取的特征与存储在第二字典中的特征进行比较,来选择特定数量的字符候选类别;特征重构单元,通过使用第三字典以及所选择的特定数量的字符候选类别来重构数量为该特定数量的重构特征;精细识别单元,根据由该特征提取单元提取的特征与该重构特征来识别并输出最终的识别字符编码;图像重构单元,通过使用该第一字典以及由该特征重构单元生成的重构特征来重构数量为该特定数量的重构图像;识别距离计算单元,用于根据所输入的归一化图像和该图像重构单元生成的重构图像来计算并输出识别距离。

    用于识别图像中的字符的字符识别装置和字符识别方法

    公开(公告)号:CN1734466A

    公开(公告)日:2006-02-15

    申请号:CN200410058334.0

    申请日:2004-08-10

    CPC classification number: G06K9/325 G06K2209/01

    Abstract: 用于识别图像中的字符的字符识别装置和字符识别方法,该字符识别装置包括:文本行提取单元,用于从输入图像中提取多个文本行;特征识别单元,用于识别各文本行的一个或更多个特征;合成模式生成单元,用于利用特征识别单元所识别出的特征以及原始字符图像,来为各文本行分别生成合成字符图像;合成词典生成单元,用于利用合成字符图像来为各文本行分别生成合成词典;文本行识别单元,用于利用合成词典来分别识别各文本行中的字符。

    用于从文档图象抽取标题的标题抽取装置及其方法

    公开(公告)号:CN1365079A

    公开(公告)日:2002-08-21

    申请号:CN01135945.5

    申请日:1996-09-04

    Inventor: 胜山裕 直井聪

    CPC classification number: G06K9/00469

    Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。

Patent Agency Ranking