-
公开(公告)号:CN100409251C
公开(公告)日:2008-08-06
申请号:CN200510093529.3
申请日:2005-08-26
Applicant: 富士通株式会社
Abstract: 用于退化文字行的字符识别装置和方法。该字符识别装置包括:特征提取单元,利用第一字典从所输入的归一化图像中提取特征;粗分类单元,通过将所提取的特征与存储在第二字典中的特征进行比较,来选择特定数量的字符候选类别;特征重构单元,通过使用第三字典以及所选择的特定数量的字符候选类别来重构数量为该特定数量的重构特征;精细识别单元,根据由该特征提取单元提取的特征与该重构特征来识别并输出最终的识别字符编码;图像重构单元,通过使用该第一字典以及由该特征重构单元生成的重构特征来重构数量为该特定数量的重构图像;识别距离计算单元,用于根据所输入的归一化图像和该图像重构单元生成的重构图像来计算并输出识别距离。
-
公开(公告)号:CN100373399C
公开(公告)日:2008-03-05
申请号:CN200410058588.2
申请日:2004-08-18
Applicant: 富士通株式会社
IPC: G06K9/62
CPC classification number: G06K9/6255
Abstract: 本发明提供了一种自动建立劣化字典的装置和方法。其中,劣化模式生成模块根据不同的劣化参数,由原始字符图像生成多个劣化模式;劣化字典生成模块在这多个劣化模式的基础上建立与多个劣化参数对应的多个劣化字典;最后字典匹配模块根据测试样本组合,确定与该测试样本组合的劣化水平最为匹配的字典作为最终的劣化字典。在本发明中,通过简单的缩放处理和模糊处理来生成不同的劣化模式,由此建立劣化字典。因此,本发明可以简单容易地实现。本发明的方法和装置不仅可以用于字符识别领域,也可以用于语音识别和面容识别等其它领域。
-
公开(公告)号:CN100369049C
公开(公告)日:2008-02-13
申请号:CN200510008512.3
申请日:2005-02-18
Applicant: 富士通株式会社
IPC: G06K9/34
CPC classification number: G06K9/346 , G06K9/00463 , G06K2209/01
Abstract: 灰度字符精确分割装置及方法。灰度字符精确分割装置包括:调整分割单元,用于对输入的经粗略分割的低分辨率文本行图像进行调整分割,从而产生经调整的字符图像;字符图像二值化单元,用于根据输入于其中的字符图像生成二值字符图像;消噪单元,用于消除所述二值化单元生成的二值字符图像中的噪声信息;最终字符图像分割单元,用于从被消除了噪声的所述二值字符图像中产生精确分割的字符图像。
-
公开(公告)号:CN100356389C
公开(公告)日:2007-12-19
申请号:CN200510135069.6
申请日:2003-12-26
Applicant: 富士通株式会社
IPC: G06K9/32
CPC classification number: G06K9/3266 , G06K2209/01
Abstract: 通过从给定的视频帧中去除多余的帧和非文本帧,选择包含文本区域的视频帧,通过去除伪笔划确定所选择的帧中的文本区域,提取文本区域中的文本行并进行二值化。
-
公开(公告)号:CN1987895A
公开(公告)日:2007-06-27
申请号:CN200610074795.6
申请日:2006-04-14
Applicant: 富士通株式会社
IPC: G06K9/20
CPC classification number: G06K9/00463
Abstract: 布局分析程序、布局分析设备和布局分析方法。能够高度准确地从图像(如果该图像为彩色图像)中提取文本块的布局分析程序、布局分析设备、布局分析方法和介质。布局分析程序使得计算机执行:分割区域提取步骤,根据二值图像提取通过图案划分的区域,以使用该提取结果作为分割区域;字符要素集合提取步骤,针对各分割区域,对通过第一二值图像布局分析处理提取的字符要素集合进行提取,以使用该提取结果作为字符要素集合;文本块提取步骤,在各分割区域中提取包含有所提取的字符要素集合的区域,以避免与第二二值图像布局处理所提取的非字符要素交叠,并使用该提取结果作为文本块;以及布局信息生成步骤,根据所述文本块以及第二二值图像布局分析处理所提取的非字符要素,生成布局信息。
-
公开(公告)号:CN1920855A
公开(公告)日:2007-02-28
申请号:CN200510093529.3
申请日:2005-08-26
Applicant: 富士通株式会社
Abstract: 用于退化文字行的字符识别装置和方法。该字符识别装置包括:特征提取单元,利用第一字典从所输入的归一化图像中提取特征;粗分类单元,通过将所提取的特征与存储在第二字典中的特征进行比较,来选择特定数量的字符候选类别;特征重构单元,通过使用第三字典以及所选择的特定数量的字符候选类别来重构数量为该特定数量的重构特征;精细识别单元,根据由该特征提取单元提取的特征与该重构特征来识别并输出最终的识别字符编码;图像重构单元,通过使用该第一字典以及由该特征重构单元生成的重构特征来重构数量为该特定数量的重构图像;识别距离计算单元,用于根据所输入的归一化图像和该图像重构单元生成的重构图像来计算并输出识别距离。
-
公开(公告)号:CN1291352C
公开(公告)日:2006-12-20
申请号:CN03141237.8
申请日:1999-02-05
Applicant: 富士通株式会社
Inventor: 胜山裕
CPC classification number: G06K9/4652 , G06K9/342 , G06K2209/01 , G06T7/11 , G06T7/12 , G06T7/143 , G06T7/90 , G06T2207/10008 , G06T2207/30176
Abstract: 本发明提供了彩色图象处理装置及图案抽取装置。阈值设定单元设定对应于所考虑的象素的颜色信息的阈值。标号单元比较相邻象素的颜色信息,并当象素的颜色信息之间的距离小于由阈值设定单元设定的阈值时,对象素设定相同的标号。
-
公开(公告)号:CN1271558C
公开(公告)日:2006-08-23
申请号:CN03132851.2
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 表格形式识别设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN1734466A
公开(公告)日:2006-02-15
申请号:CN200410058334.0
申请日:2004-08-10
Applicant: 富士通株式会社
CPC classification number: G06K9/325 , G06K2209/01
Abstract: 用于识别图像中的字符的字符识别装置和字符识别方法,该字符识别装置包括:文本行提取单元,用于从输入图像中提取多个文本行;特征识别单元,用于识别各文本行的一个或更多个特征;合成模式生成单元,用于利用特征识别单元所识别出的特征以及原始字符图像,来为各文本行分别生成合成字符图像;合成词典生成单元,用于利用合成字符图像来为各文本行分别生成合成词典;文本行识别单元,用于利用合成词典来分别识别各文本行中的字符。
-
公开(公告)号:CN1365079A
公开(公告)日:2002-08-21
申请号:CN01135945.5
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。
-
-
-
-
-
-
-
-
-