-
公开(公告)号:CN101425141A
公开(公告)日:2009-05-06
申请号:CN200810174982.0
申请日:2008-10-31
申请人: 富士通株式会社
CPC分类号: G06K9/2054 , G06K2209/01
摘要: 图像识别装置、图像识别程序和图像识别方法。一种图像识别方法,该方法针对将各字符串分别描述为构成逻辑结构的多个逻辑元素的图像,并基于以对应于该逻辑结构的方式设置的逻辑结构模型来识别各逻辑元素,该方法包括以下步骤:收集关于待利用该逻辑结构模型处理的逻辑结构的图像的信息;在以对应于新逻辑结构的方式将该逻辑结构模型更新为新逻辑结构模型时,通过以更新后的逻辑结构模型来处理收集的信息而获得在基于更新后的结构模型针对与更新前的逻辑结构模型相对应的逻辑结构的图像进行识别时的识别结果;比较在利用更新前的逻辑结构模型处理所收集的信息时的识别结果是否和根据更新后的逻辑结构模型所获取的识别结果相匹配;并且在比较的结果为不匹配的情况下,向输出单元输出表示关于更新后的逻辑结构模型的警告的警告信息。
-
公开(公告)号:CN101425132A
公开(公告)日:2009-05-06
申请号:CN200810170687.8
申请日:2008-10-30
申请人: 富士通株式会社
IPC分类号: G06K9/00
CPC分类号: G06K9/033 , G06K9/726 , G06K2209/01
摘要: 本发明提供图像识别装置和方法及记录图像识别程序的存储介质。图像识别装置对其中字符串被描述为逻辑元素的图像中的字符串与组成逻辑结构的逻辑元素之间的对应关系进行识别以识别每个逻辑元素。该图像识别装置包括:输出装置,用于在识别或重新识别所述对应关系时,输出所识别的逻辑元素;第一确定装置,用于在从用户接收到用于确定所述逻辑元素的确定请求的输入时,确定特定逻辑元素为正确;第二确定装置,用于确定在第一确定装置确定的所述逻辑元素之前输出的并根据用户的确认而定位的所有逻辑元素的正确性;以及重新识别装置,用于基于每个逻辑元素的确定内容,来重新识别仍未被确定为正确的逻辑元素与字符串之间的对应关系。
-
公开(公告)号:CN101430758A
公开(公告)日:2009-05-13
申请号:CN200810174109.1
申请日:2008-11-07
申请人: 富士通株式会社
CPC分类号: G06K9/2081 , G06K2209/01
摘要: 本发明涉及文档识别装置和方法。一种文档识别装置,该文档识别装置包括显示控制单元,该显示控制单元显示包括与用户选择的字符串相关的字符串的文档数据,并显示至少包括该文档数据的字符串的区域。
-
-
公开(公告)号:CN101430758B
公开(公告)日:2012-10-10
申请号:CN200810174109.1
申请日:2008-11-07
申请人: 富士通株式会社
CPC分类号: G06K9/2081 , G06K2209/01
摘要: 本发明涉及文档识别装置和方法。一种文档识别装置,该文档识别装置包括显示控制单元,该显示控制单元显示包括与用户选择的字符串相关的字符串的文档数据,并显示至少包括该文档数据的字符串的区域。
-
公开(公告)号:CN101452443B
公开(公告)日:2011-11-23
申请号:CN200810180800.0
申请日:2008-12-05
申请人: 富士通株式会社
CPC分类号: G06F17/243
摘要: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。
-
公开(公告)号:CN101452443A
公开(公告)日:2009-06-10
申请号:CN200810180800.0
申请日:2008-12-05
申请人: 富士通株式会社
CPC分类号: G06F17/243
摘要: 一种用于辅助进行逻辑结构模型创建的方法,该逻辑结构模型存储来自其中描述了分别与组成逻辑结构的多个逻辑元素相关联的字符串的图像的逻辑元素、与所述逻辑元素相关联的字符串、以及逻辑结构,其中提取输入图像中的字符串以及输入图像中的字符串间的逻辑结构;根据提取的字符串和分别与存储在所述逻辑结构模型中的多个逻辑元素相关联的字符串之间的类似程度,选择多个逻辑元素中的逻辑元素;提取与所选择的逻辑元素相关联的字符串以及输入图像中与基于提取的输入图像中的字符串间的逻辑结构的逻辑元素相关联的字符串。
-
公开(公告)号:CN100456317C
公开(公告)日:2009-01-28
申请号:CN200610066977.9
申请日:2006-03-30
申请人: 富士通株式会社
IPC分类号: G06K9/32
摘要: 本发明的课题在于提高行方向判定的准确率。本行方向判定方法包含:取得由对纵写或横写文字组读取结果的纵方向文字识别处理所得到的第1识别文字数、和由对读取结果的横方向文字识别处理所得到的第2识别文字数的步骤;参照存储n(n是大于等于2的整数)个连续文字的出现概率的n-gram数据存储部,算出由纵方向文字识别处理所得到的n个连续识别文字的第1平均出现概率、和由横方向文字识别处理所得到的n个连续识别文字的第2平均出现概率的步骤;以及在第1识别文字数和第2识别文字数满足规定条件的情况下,根据第1平均出现概率和第2平均出现概率的大小判定纵写或横写的判定步骤。这样通过使用n-gram,即使在识别出不是单词的用语的情况下,也能准确判定行方向。
-
公开(公告)号:CN102024138B
公开(公告)日:2013-01-23
申请号:CN200910173692.9
申请日:2009-09-15
申请人: 富士通株式会社
摘要: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。
-
公开(公告)号:CN101430761B
公开(公告)日:2012-10-10
申请号:CN200810174108.7
申请日:2008-11-07
申请人: 富士通株式会社
IPC分类号: G06K9/20
CPC分类号: G06K9/00449
摘要: 本发明涉及计算机可读记录介质、表格数据提取装置和方法。即使输入了不具有存储在公共逻辑结构数据库中的逻辑结构的输入表格,表格数据提取装置借助现有的逻辑结构中的逻辑元素和在逻辑结构、逻辑元素的位置信息和逻辑元素之间的关系基础上获得的登记表格而从输入表格中提取出逻辑元素和逻辑结构,并且可以将提取出的逻辑结构定义为新的登记表格或者新的逻辑结构。
-
-
-
-
-
-
-
-
-