一种基于标准字形生成的自然场景文字识别方法
摘要:
本发明公布了一种基于标准字形生成的文字识别方法,建立基于注意力机制和生成机制的神经网络模型,在每个时刻将注意力集中在图片的某个位置,利用该位置的神经网络特征,分别进行文字类别的预测和生成多字体标准字形,直到遍历图片中的所有文字为止,实现对一张包含一个或多个文字的自然场景图片中的文字进行识别和输出。本发明利用多字体字形生成,改进了注意力模块,提高了文字识别精度和字形生成质量,从而提升了文字识别的准确度。
0/0