-
公开(公告)号:CN1737824A
公开(公告)日:2006-02-22
申请号:CN200410058588.2
申请日:2004-08-18
Applicant: 富士通株式会社
IPC: G06K9/62
CPC classification number: G06K9/6255
Abstract: 本发明提供了一种自动建立劣化字典的装置和方法。其中,劣化模式生成模块根据不同的劣化参数,由原始字符图像生成多个劣化模式;劣化字典生成模块在这多个劣化模式的基础上建立与多个劣化参数对应的多个劣化字典;最后字典匹配模块根据测试样本组合,确定与该测试样本组合的劣化水平最为匹配的字典作为最终的劣化字典。在本发明中,通过简单的缩放处理和模糊处理来生成不同的劣化模式,由此建立劣化字典。因此,本发明可以简单容易地实现。本发明的方法和装置不仅可以用于字符识别领域,也可以用于语音识别和面容识别等其它领域。
-
公开(公告)号:CN1534542A
公开(公告)日:2004-10-06
申请号:CN03132852.0
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 管理信息提取设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN1534539A
公开(公告)日:2004-10-06
申请号:CN03132851.2
申请日:1997-12-26
Applicant: 富士通株式会社
CPC classification number: G06K9/2054 , G06K2209/01 , Y10S707/99936
Abstract: 表格形式识别设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。
-
公开(公告)号:CN1094224C
公开(公告)日:2002-11-13
申请号:CN96111897.0
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。在表格式文档的情形下,该标题抽取装置可从表的内部抽取一个标题矩形。从标题矩形所抽取的字符通过字符识别处理用作为文档图象的关键字。
-
公开(公告)号:CN1234569A
公开(公告)日:1999-11-10
申请号:CN99101770.6
申请日:1999-02-05
Applicant: 富士通株式会社
Inventor: 胜山裕
CPC classification number: G06K9/4652 , G06K9/342 , G06K2209/01 , G06T7/11 , G06T7/12 , G06T7/143 , G06T7/90 , G06T2207/10008 , G06T2207/30176
Abstract: 阈值设定单元设定对应于所考虑的象素的颜色信息的阈值。标号单元比较相邻象素的颜色信息,并当象素的颜色信息之间的距离小于由阈值设定单元设定的阈值时,对象素设定相同的标号。
-
公开(公告)号:CN1153955A
公开(公告)日:1997-07-09
申请号:CN96111897.0
申请日:1996-09-04
Applicant: 富士通株式会社
CPC classification number: G06K9/00469
Abstract: 一种标题抽取装置扫描文档图象中的黑色象素并抽取外接黑色象素连接区域的矩形区域作为字符矩形。此外,该标题抽取装置一致化邻接的多个字符矩形并抽取外接字符矩形的矩形区域作为字符串矩形。然后,该标题抽取装置利用对应于每一字符串矩形的诸如下划线属性、框架属性、和定界线属性,文档图象中的字符串矩形的位置,以及相互位置关系的属性作为标题的似然性而计算点数,并抽取带有最高点数的字符串矩形作为标题矩形。
-
-
-
-
-