一种基于结构增强注意力的英文艺术文字识别方法
摘要:
本发明公开一种基于结构增强注意力的英文艺术字识别方法。针对艺术文字的复杂结构以及多变的字形,本发明采用注意力编码器和MGP‑STR多粒度解码器,实现更精确、更鲁棒的英文艺术文字识别。本发明方法包括:输入英文艺术文字图像,对艺术文字进行初级图像处理,处理之后送入艺术文字识别编码器,融入专用文字分割模块,通过交叉融合注意力机制辅助视觉特征提取,获得艺术文本精准的视觉特征。之后通过多级解码器,融入语言信息,得到英文艺术文字识别结果。面对水平、弯曲等背景复杂的艺术文本,本发明提供了一个更通用且能力更强大的艺术文字识别模型。
0/0