图像识别装置、图像识别程序和图像识别方法

    公开(公告)号:CN101425141A

    公开(公告)日:2009-05-06

    申请号:CN200810174982.0

    申请日:2008-10-31

    IPC分类号: G06K9/20 G06K9/78

    CPC分类号: G06K9/2054 G06K2209/01

    摘要: 图像识别装置、图像识别程序和图像识别方法。一种图像识别方法,该方法针对将各字符串分别描述为构成逻辑结构的多个逻辑元素的图像,并基于以对应于该逻辑结构的方式设置的逻辑结构模型来识别各逻辑元素,该方法包括以下步骤:收集关于待利用该逻辑结构模型处理的逻辑结构的图像的信息;在以对应于新逻辑结构的方式将该逻辑结构模型更新为新逻辑结构模型时,通过以更新后的逻辑结构模型来处理收集的信息而获得在基于更新后的结构模型针对与更新前的逻辑结构模型相对应的逻辑结构的图像进行识别时的识别结果;比较在利用更新前的逻辑结构模型处理所收集的信息时的识别结果是否和根据更新后的逻辑结构模型所获取的识别结果相匹配;并且在比较的结果为不匹配的情况下,向输出单元输出表示关于更新后的逻辑结构模型的警告的警告信息。

    行方向判定方法以及装置

    公开(公告)号:CN101350067A

    公开(公告)日:2009-01-21

    申请号:CN200810145613.9

    申请日:2006-03-30

    IPC分类号: G06K9/32

    摘要: 一种行方向判定方法包含:算出对纵写或横写文字组读取结果的纵方向文字识别结果的第1平均确信度、和横方向文字识别结果的第2平均确信度的步骤;以及根据第1平均确信度和第2平均确信度的大小判定纵写或横写的步骤。这样,通过使用上述判定方法,能指定正确的行方向,从而提高了行方向判定的准确率。

    逻辑结构模型创建辅助设备和方法

    公开(公告)号:CN101452443B

    公开(公告)日:2011-11-23

    申请号:CN200810180800.0

    申请日:2008-12-05

    IPC分类号: G06F17/22 G06K9/20

    CPC分类号: G06F17/243

    摘要: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。

    逻辑结构模型创建辅助设备和方法,用于其的记录介质

    公开(公告)号:CN101452443A

    公开(公告)日:2009-06-10

    申请号:CN200810180800.0

    申请日:2008-12-05

    IPC分类号: G06F17/22 G06K9/20

    CPC分类号: G06F17/243

    摘要: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。

    行方向判定方法以及装置

    公开(公告)号:CN100456317C

    公开(公告)日:2009-01-28

    申请号:CN200610066977.9

    申请日:2006-03-30

    IPC分类号: G06K9/32

    摘要: 本发明的课题在于提高行方向判定的准确率。本行方向判定方法包含:取得由对纵写或横写文字组读取结果的纵方向文字识别处理所得到的第1识别文字数、和由对读取结果的横方向文字识别处理所得到的第2识别文字数的步骤;参照存储n(n是大于等于2的整数)个连续文字的出现概率的n-gram数据存储部,算出由纵方向文字识别处理所得到的n个连续识别文字的第1平均出现概率、和由横方向文字识别处理所得到的n个连续识别文字的第2平均出现概率的步骤;以及在第1识别文字数和第2识别文字数满足规定条件的情况下,根据第1平均出现概率和第2平均出现概率的大小判定纵写或横写的判定步骤。这样通过使用n-gram,即使在识别出不是单词的用语的情况下,也能准确判定行方向。

    字符识别方法和字符识别装置

    公开(公告)号:CN102024138B

    公开(公告)日:2013-01-23

    申请号:CN200910173692.9

    申请日:2009-09-15

    IPC分类号: G06K9/00 G06K9/34

    摘要: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。

    表格数据提取装置和方法
    10.
    发明授权

    公开(公告)号:CN101430761B

    公开(公告)日:2012-10-10

    申请号:CN200810174108.7

    申请日:2008-11-07

    IPC分类号: G06K9/20

    CPC分类号: G06K9/00449

    摘要: 本发明涉及计算机可读记录介质、表格数据提取装置和方法。即使输入了不具有存储在公共逻辑结构数据库中的逻辑结构的输入表格,表格数据提取装置借助现有的逻辑结构中的逻辑元素和在逻辑结构、逻辑元素的位置信息和逻辑元素之间的关系基础上获得的登记表格而从输入表格中提取出逻辑元素和逻辑结构,并且可以将提取出的逻辑结构定义为新的登记表格或者新的逻辑结构。