一种基于文本选取模型的无监督文本定位方法
摘要:
本发明公开了一种基于文本选取模型的无监督文本定位方法。本发明通过SLIC和DBSCAN图像分割生成若干个超像素,并创新地将超像素区域作为文本候选区域,解决了候选区域在数量和精度上的平衡;其次,本发明利用同一张图中文本对象之间的相似性建立文本选取模型,生成样本参考图,其中,样本参考图包括强文本图和非文本图,并以样本参考图为依据,通过双阈值机制自适应地提取以超像素为单位的文本样本,避免了传统算法对于数据库的依赖性;最后,通过文本样本训练得到文本分类器并对超像素区域进行文本/非文本分类;该方法召回率高,避免了传统算法中依赖数据库、通用性较差、候选区域数量爆炸的问题,实现了无监督的文本定位目标。
公开/授权文献
0/0