-
公开(公告)号:CN101266654A
公开(公告)日:2008-09-17
申请号:CN200710064388.1
申请日:2007-03-14
Applicant: 中国科学院自动化研究所
IPC: G06K9/72
Abstract: 本发明公开基于连通分量和支持向量机的图像中文本定位的方法和装置,图像分割单元,连通域分析单元;连通分量特征获取和阈值确认单元,支持向量机分类单元,连通分量组合成文本区域单元,文本区域统计特征获取并确认单元;方法将输入图像分割得到图像分层结果,用连通域分析对前景层进行分析得到连通分量的集合;提取出连通分量特征,通过使用级联阈值分类器的结构排除大量的非字符连通分量,对剩下的候选字符连通分量再运用支持向量机分类方法进行识别是否是字符连通分量;对剩余的连通分量根据特征一致和距离相近原则组合成候选文本区域,并提取出这些候选文本区域的特征,对这些特征用经验性的阈值确认是否为文本区域。
-
公开(公告)号:CN100565559C
公开(公告)日:2009-12-02
申请号:CN200710064388.1
申请日:2007-03-14
Applicant: 中国科学院自动化研究所
IPC: G06K9/72
Abstract: 本发明公开基于连通分量和支持向量机的图像中文本定位的方法和装置,图像分割单元,连通域分析单元;连通分量特征获取和阈值确认单元,支持向量机分类单元,连通分量组合成文本区域单元,文本区域统计特征获取并确认单元;方法将输入图像分割得到图像分层结果,用连通域分析对前景层进行分析得到连通分量的集合;提取出连通分量特征,通过使用级联阈值分类器的结构排除大量的非字符连通分量,对剩下的候选字符连通分量再运用支持向量机分类方法进行识别是否是字符连通分量;对剩余的连通分量根据特征一致和距离相近原则组合成候选文本区域,并提取出这些候选文本区域的特征,对这些特征用经验性的阈值确认是否为文本区域。
-