- 专利标题: 一种基于边界点检测的场景文本端到端识别方法
- 专利标题(英): Scene text end-to-end identification method based on boundary point detection
-
申请号: CN201911038568.1申请日: 2019-10-29
-
公开(公告)号: CN110837835A公开(公告)日: 2020-02-25
- 发明人: 刘文予 , 白翔 , 许永超 , 王豪 , 卢普 , 张辉 , 杨明锟 , 何梦超 , 王永攀
- 申请人: 华中科技大学
- 申请人地址: 湖北省武汉市洪山区珞喻路1037号
- 专利权人: 华中科技大学
- 当前专利权人: 华中科技大学
- 当前专利权人地址: 湖北省武汉市洪山区珞喻路1037号
- 代理机构: 深圳市六加知识产权代理有限公司
- 代理商 向彬
- 主分类号: G06K9/34
- IPC分类号: G06K9/34 ; G06K9/46 ; G06K9/62
摘要:
本发明公开了一种基于边界点检测的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过多方向矩形检测网络检测文本实例的更为精准的多方向包围盒;其次在多方向包围盒内检测文本的上下两条边界点序列;最后利用检测到的边界点序列将任意形状的文本转化为水平文本供后续的基于注意力机制的序列识别网络进行识别,最后利用集束搜索算法找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以在不需要字符级别的标注情况下同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。
公开/授权文献
- CN110837835B 一种基于边界点检测的场景文本端到端识别方法 公开/授权日:2022-11-08