-
公开(公告)号:CN101546424B
公开(公告)日:2012-07-25
申请号:CN200810087720.0
申请日:2008-03-24
申请人: 富士通株式会社
摘要: 本发明提供了一种图像处理方法及装置,用于从三幅或三幅以上的多幅图像中找出共有图案。该方法包括:对N幅图像进行图像特征提取,根据特征提取的结果将N幅图像分为C层,使得共有图案的图像基本上聚集在C层中的某一层中,其中C为自然数且大于等于2;计算每一层的N幅图像的平均相似度;以及将平均相似度最大的那一层的合成图像确定为包含共有图案的图像,其中,合成图像是以该层的基准图像为基础,将N幅图像进行合成而得到的,而基准图像是该层的N幅图像中的一幅与其余N-1幅图像的匹配优选的图像。本发明还提供了一种包含上述图像处理装置的水印检测系统。本发明可以应用于从多幅文档图像中检测水印。
-
公开(公告)号:CN101515323B
公开(公告)日:2012-07-18
申请号:CN200910004255.4
申请日:2009-02-18
申请人: 富士通株式会社
CPC分类号: G06K9/344 , G06K2209/01
摘要: 一种字符识别装置,包括:划分机制,用于将图划分为多个部分;候选字符串获取机制,用于组合图的多个部分;以及字符串选择机制,用于选择一个字符串。所述候选字符串获取机制至少包括下述之一:第一机制,用于复制接触相邻字符的字符线,然后将所复制的字符线包括为候选字符串的元素;以及第二机制,用于在多个候选字符串中包括已经移除相邻字符之间的接触字符线的候选字符串、和包含所述接触字符线的候选字符串。
-
公开(公告)号:CN101425141B
公开(公告)日:2012-06-13
申请号:CN200810174982.0
申请日:2008-10-31
申请人: 富士通株式会社
CPC分类号: G06K9/2054 , G06K2209/01
摘要: 图像识别装置、图像识别程序和图像识别方法。一种图像识别方法,该方法针对将各字符串分别描述为构成逻辑结构的多个逻辑元素的图像,并基于以对应于该逻辑结构的方式设置的逻辑结构模型来识别各逻辑元素,该方法包括以下步骤:收集关于待利用该逻辑结构模型处理的逻辑结构的图像的信息;在以对应于新逻辑结构的方式将该逻辑结构模型更新为新逻辑结构模型时,通过以更新后的逻辑结构模型来处理收集的信息而获得在基于更新后的结构模型针对与更新前的逻辑结构模型相对应的逻辑结构的图像进行识别时的识别结果;比较在利用更新前的逻辑结构模型处理所收集的信息时的识别结果是否和根据更新后的逻辑结构模型所获取的识别结果相匹配;并且在比较的结果为不匹配的情况下,向输出单元输出表示关于更新后的逻辑结构模型的警告的警告信息。
-
公开(公告)号:CN101226594B
公开(公告)日:2012-05-30
申请号:CN200810003055.2
申请日:2008-01-18
申请人: 富士通株式会社
CPC分类号: G06K9/346 , G06K2209/01
摘要: 本发明涉及一种图案分离提取装置和图案分离提取方法。当操作者启动图案分离提取工具时,在显示装置上显示输入画面。操作者可以通过该输入画面选择并指定存储装置内的任何一个文件图像数据。将操作者选择的文件图像显示在显示装置上。操作者可以在该显示装置上显示的文件图像上,通过拖动操作来选择并指定颜色样本。如果操作者在指定一些颜色样本之后,通过输入装置输入结束指定颜色样本的指定,则图案分离提取装置对操作者选择的文件图像中所包括的每一个印刷图案,生成并输出包括一个印刷图案的图像数据。
-
-
公开(公告)号:CN101364267B
公开(公告)日:2011-09-28
申请号:CN200810108259.2
申请日:2008-06-05
申请人: 富士通株式会社
IPC分类号: G06K9/62
CPC分类号: G06K9/2054 , G06K9/4671 , G06K2209/01
摘要: 本发明公开了一种字符识别装置、字符识别方法及计算机产品,该字符识别装置包含哈希表注册单元和识别处理单元。哈希表注册单元创建哈希表,该哈希表将每个部分字符图像的特征表达为每个字符的区域。识别处理单元将输入图像划分为多个部分输入图像,并且计算每个部分输入图像的特征。识别处理单元在哈希表中查找具有与每个部分输入图像的特征相似的特征的部分字符图像。识别处理单元将多个部分输入图像之间的位置关系与多个部分字符图像之间的位置关系进行比较,以判定它们是否匹配,并识别出输入图像的每个区域中的字符。本发明能够以高准确度并高速识别出与任意形状的图案重叠的字符图像。
-
公开(公告)号:CN101373519B
公开(公告)日:2011-01-19
申请号:CN200710146535.X
申请日:2007-08-20
申请人: 富士通株式会社
IPC分类号: G06K9/72
摘要: 本发明提供了一种字符识别装置和方法。本发明的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
-
公开(公告)号:CN100589532C
公开(公告)日:2010-02-10
申请号:CN200710140327.9
申请日:2007-08-09
申请人: 富士通株式会社
摘要: 本发明提供了一种字幕区域提取装置和方法。本发明的目的是从视频信号中高效、精确地提取字幕区域。为此,本发明的字幕区域提取装置具有视频解码单元,其对所述视频信号进行解码,生成多帧图像;图像选择单元,其按照时间顺序把所述视频解码单元输出的所述多帧图像分成预定大小的图像组,对于每个图像组,基于边缘特征选择预定数量的图像;平均单元,其对于各个所述图像组,对所述图像选择单元选择的图像进行平均处理,得到平均图像;以及提取单元,其从所述平均图像中提取角点,基于所述角点从所述平均图像中提取出字幕区域。根据本发明,即使存在动态的背景,也能够鲁棒地提取出字幕区域。
-
公开(公告)号:CN101582118A
公开(公告)日:2009-11-18
申请号:CN200910138419.2
申请日:2009-05-11
申请人: 富士通株式会社
IPC分类号: G06K9/64
CPC分类号: G06K9/6255
摘要: 本发明涉及字典创建装置、识别装置及识别方法。所述字典创建装置将分别包括平均向量及协方差矩阵的概率分布登记在字典中。所述字典创建装置将具有相似的特征向量的字符类别的多个分布轮廓组织成一个典型分布轮廓,并将该典型分布轮廓与被组织的字符类别彼此关联地登记在字典中,而不将所有的字符类别的本征值及本征向量彼此关联地登记在字典中。
-
公开(公告)号:CN101546424A
公开(公告)日:2009-09-30
申请号:CN200810087720.0
申请日:2008-03-24
申请人: 富士通株式会社
摘要: 本发明提供了一种图像处理方法及装置,用于从三幅或三幅以上的多幅图像中找出共有图案。该方法包括:对N幅图像进行图像特征提取,根据特征提取的结果将N幅图像分为C层,使得共有图案的图像基本上聚集在C层中的某一层中,其中C为自然数且大于等于2;计算每一层的N幅图像的平均相似度;以及将平均相似度最大的那一层的合成图像确定为包含共有图案的图像,其中,合成图像是以该层的基准图像为基础,将N幅图像进行合成而得到的,而基准图像是该层的N幅图像中的一幅与其余N-1幅图像的匹配优选的图像。本发明还提供了一种包含上述图像处理装置的水印检测系统。本发明可以应用于从多幅文档图像中检测水印。
-
-
-
-
-
-
-
-
-