发明公开
- 专利标题: 一种基于结构增强注意力的英文艺术文字识别方法
-
申请号: CN202311640662.0申请日: 2023-12-04
-
公开(公告)号: CN117612151A公开(公告)日: 2024-02-27
- 发明人: 陈志华 , 王敏 , 戴蕾 , 唐铖毓 , 陈凯
- 申请人: 华东理工大学
- 申请人地址: 上海市徐汇区梅陇路130号
- 专利权人: 华东理工大学
- 当前专利权人: 华东理工大学
- 当前专利权人地址: 上海市徐汇区梅陇路130号
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V10/82 ; G06V30/148 ; G06V30/18 ; G06V30/19 ; G06N3/0455 ; G06N3/0464 ; G06N3/08
摘要:
本发明公开一种基于结构增强注意力的英文艺术字识别方法。针对艺术文字的复杂结构以及多变的字形,本发明采用注意力编码器和MGP‑STR多粒度解码器,实现更精确、更鲁棒的英文艺术文字识别。本发明方法包括:输入英文艺术文字图像,对艺术文字进行初级图像处理,处理之后送入艺术文字识别编码器,融入专用文字分割模块,通过交叉融合注意力机制辅助视觉特征提取,获得艺术文本精准的视觉特征。之后通过多级解码器,融入语言信息,得到英文艺术文字识别结果。面对水平、弯曲等背景复杂的艺术文本,本发明提供了一个更通用且能力更强大的艺术文字识别模型。