文件图像处理方法和设备
    71.
    发明公开

    公开(公告)号:CN102375988A

    公开(公告)日:2012-03-14

    申请号:CN201010257650.6

    申请日:2010-08-17

    IPC分类号: G06K9/46 G06K9/62

    摘要: 本发明公开了一种文件图像处理方法和设备,其中文件图像处理方法包括:对文件图像进行水平文本行提取;对文件图像进行垂直文本行提取;设置重叠矩阵,所述重叠矩阵的元素的值指示了水平文本行和垂直文本行之间的重叠关系;在垂直方向上对重叠矩阵进行合并;在水平方向上对重叠矩阵进行合并;基于合并后的重叠矩阵的元素的值,确定文件图像中的一个或多个文本重叠区域;在一个或多个文本重叠区域中的一个内,分别对水平文本行和垂直文本行的笔画或像素点总数进行计数;以及如果水平文本行的笔画或像素点总数大于垂直文本行的笔画或像素点总数,则确定该文本重叠区域的取向是水平取向,反之则确定该文本重叠区域的取向是垂直取向。

    遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法

    公开(公告)号:CN102208022A

    公开(公告)日:2011-10-05

    申请号:CN201010137689.4

    申请日:2010-03-31

    IPC分类号: G06K9/20 G06K9/34

    摘要: 本发明公开了一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法。根据本发明的遮挡字符恢复方法包括:根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。

    一种字符识别的方法、装置

    公开(公告)号:CN101256631B

    公开(公告)日:2011-06-01

    申请号:CN200710078767.6

    申请日:2007-02-26

    IPC分类号: G06K9/62

    摘要: 本发明提供一种字符识别的方法、装置、程序和可读存储介质。所述方法包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果;若为变形样本,则对变形样本进行识别并生成最终识别结果。本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,从而提高系统的识别精度。

    字符识别方法和字符识别装置

    公开(公告)号:CN102024138A

    公开(公告)日:2011-04-20

    申请号:CN200910173692.9

    申请日:2009-09-15

    IPC分类号: G06K9/00 G06K9/34

    摘要: 本发明公开了一种字符识别方法和字符识别装置。根据本发明的一个实施例的字符识别方法包括:根据要识别的字符图像中标记字符上的标记的位置和形状特征提取所述标记的部分标记像素;通过包含具有相同方向的相邻像素将所述提取的部分标记像素扩展为标记线段;获取要识别的所述字符图像的细化图像;沿着所述细化图像的轨迹将所述扩展的标记线段生长为识别的标记;将所述识别的标记与所述字符图像分离;以及识别所述分离的字符图像。

    指定颜色层提取设备和方法

    公开(公告)号:CN101799929A

    公开(公告)日:2010-08-11

    申请号:CN200910007306.9

    申请日:2009-02-11

    IPC分类号: G06T7/40

    摘要: 本发明涉及指定颜色层提取方法和设备。该指定颜色层提取设备,用于从彩色图像中提取目标颜色层,所述指定颜色层提取设备包括:矢量轴设定单元,将从背景颜色中心到目标颜色中心的矢量单位化,成为矢量轴;强度层提取器,利用所述矢量轴,计算消除背景颜色影响的强度层图像;色差层提取器,利用所述矢量轴,计算消除所述背景颜色和所述目标颜色之外的其它颜色的影响的色差层图像;和复合器,把所述强度层图像和色差层图像结合,把结合的结果归一化,输出代表目标色强弱程度的灰度图像。

    字符信息识别装置和方法
    76.
    发明公开

    公开(公告)号:CN101520851A

    公开(公告)日:2009-09-02

    申请号:CN200810080950.4

    申请日:2008-02-29

    IPC分类号: G06K9/72 G06K9/00

    摘要: 本发明提供了一种字符信息识别装置和方法,其输入包含字符串的字符串图像,由该字符串图像识别出所述字符串,其中该字符串被分隔符划分为两个以上的字段。本发明的字符信息识别装置包括:切分单元,其将字符串图像切分成多个片段;分隔符识别单元,其基于切分后的片段,识别出分隔符,从而将所述多个片段分成多个片段集;词典数据库,其中存储了多个预定的字符组;以及识别单元,其对于各个片段集,将该片段集的至少一部分识别为词典数据库中的字符组,从而识别出各个字段。根据本发明,可以大大提高手写体的Email地址、网络地址等信息的识别精度,即使在存在笔画粘接的情况下,也可以在满意的精度下进行识别。

    一种字符识别的方法、装置、程序和可读存储介质

    公开(公告)号:CN101256631A

    公开(公告)日:2008-09-03

    申请号:CN200710078767.6

    申请日:2007-02-26

    IPC分类号: G06K9/62

    摘要: 本发明提供一种字符识别的方法、装置、程序和可读存储介质。所述方法包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果;若为变形样本,则对变形样本进行识别并生成最终识别结果。本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,从而提高系统的识别精度。

    用于退化文字行的字符识别装置和方法

    公开(公告)号:CN100409251C

    公开(公告)日:2008-08-06

    申请号:CN200510093529.3

    申请日:2005-08-26

    IPC分类号: G06K9/62 G06K9/20 G06K9/46

    摘要: 用于退化文字行的字符识别装置和方法。该字符识别装置包括:特征提取单元,利用第一字典从所输入的归一化图像中提取特征;粗分类单元,通过将所提取的特征与存储在第二字典中的特征进行比较,来选择特定数量的字符候选类别;特征重构单元,通过使用第三字典以及所选择的特定数量的字符候选类别来重构数量为该特定数量的重构特征;精细识别单元,根据由该特征提取单元提取的特征与该重构特征来识别并输出最终的识别字符编码;图像重构单元,通过使用该第一字典以及由该特征重构单元生成的重构特征来重构数量为该特定数量的重构图像;识别距离计算单元,用于根据所输入的归一化图像和该图像重构单元生成的重构图像来计算并输出识别距离。

    灰度字符的精确分割装置及方法

    公开(公告)号:CN100369049C

    公开(公告)日:2008-02-13

    申请号:CN200510008512.3

    申请日:2005-02-18

    IPC分类号: G06K9/34

    摘要: 灰度字符精确分割装置及方法。灰度字符精确分割装置包括:调整分割单元,用于对输入的经粗略分割的低分辨率文本行图像进行调整分割,从而产生经调整的字符图像;字符图像二值化单元,用于根据输入于其中的字符图像生成二值字符图像;消噪单元,用于消除所述二值化单元生成的二值字符图像中的噪声信息;最终字符图像分割单元,用于从被消除了噪声的所述二值字符图像中产生精确分割的字符图像。