发明公开
- 专利标题: 一种基于注意力机制的OCR文字识别方法和系统
-
申请号: CN202211182141.0申请日: 2022-09-27
-
公开(公告)号: CN115497095A公开(公告)日: 2022-12-20
- 发明人: 张盛洪 , 张国慧 , 张志坚 , 罗瑞明 , 王硕君 , 英树祥 , 邓雄文 , 梁岸平 , 蒋秀
- 申请人: 广东电网有限责任公司江门供电局 , 广东电网有限责任公司
- 申请人地址: 广东省江门市蓬江区建设二路152号;
- 专利权人: 广东电网有限责任公司江门供电局,广东电网有限责任公司
- 当前专利权人: 广东电网有限责任公司江门供电局,广东电网有限责任公司
- 当前专利权人地址: 广东省江门市蓬江区建设二路152号;
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 李伟贤
- 主分类号: G06V30/14
- IPC分类号: G06V30/14 ; G06V30/19 ; G06V10/82 ; G06N3/04
摘要:
本发明提供了一种基于注意力机制的OCR文字识别方法和系统,通过使用带有注意力机制的多尺度特征融合方法能够保留更多文本特征,从而改善文本的漏检情况。另外在获得最终特征图时使用坐标注意力来捕捉远距离的特征相关性,更有利于长文本的检测。同时采用了简单的后处理,提高了文本检测的准确度与推理速度,进而使文本的识别结果更准确。