建立劣化字典的方法和装置

    公开(公告)号:CN1737824A

    公开(公告)日:2006-02-22

    申请号:CN200410058588.2

    申请日:2004-08-18

    CPC classification number: G06K9/6255

    Abstract: 本发明提供了一种自动建立劣化字典的装置和方法。其中,劣化模式生成模块根据不同的劣化参数,由原始字符图像生成多个劣化模式;劣化字典生成模块在这多个劣化模式的基础上建立与多个劣化参数对应的多个劣化字典;最后字典匹配模块根据测试样本组合,确定与该测试样本组合的劣化水平最为匹配的字典作为最终的劣化字典。在本发明中,通过简单的缩放处理和模糊处理来生成不同的劣化模式,由此建立劣化字典。因此,本发明可以简单容易地实现。本发明的方法和装置不仅可以用于字符识别领域,也可以用于语音识别和面容识别等其它领域。

    图像积累设备与方法
    72.
    发明公开

    公开(公告)号:CN1534542A

    公开(公告)日:2004-10-06

    申请号:CN03132852.0

    申请日:1997-12-26

    CPC classification number: G06K9/2054 G06K2209/01 Y10S707/99936

    Abstract: 管理信息提取设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。

    用于从文档图象抽取标题的标题抽取装置及其方法

    公开(公告)号:CN1094224C

    公开(公告)日:2002-11-13

    申请号:CN96111897.0

    申请日:1996-09-04

    Inventor: 胜山裕 直井聪

    CPC classification number: G06K9/00469

    Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。

    用于从文档图象抽取标题的标题抽取装置及其方法

    公开(公告)号:CN1153955A

    公开(公告)日:1997-07-09

    申请号:CN96111897.0

    申请日:1996-09-04

    Inventor: 胜山裕 直井聪

    CPC classification number: G06K9/00469

    Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。

Patent Agency Ranking