发明授权
- 专利标题: 基于核尺度扩张的文本检测方法
-
申请号: CN202110262362.8申请日: 2021-03-10
-
公开(公告)号: CN113159020B公开(公告)日: 2023-06-06
- 发明人: 刘义江 , 陈蕾 , 侯栋梁 , 池建昆 , 范辉 , 阎鹏飞 , 魏明磊 , 李云超 , 姜琳琳 , 辛锐 , 陈曦 , 杨青 , 沈静文 , 吴彦巧 , 姜敬 , 檀小亚 , 师孜晗
- 申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
- 申请人地址: 河北省石家庄市富强大街32号;
- 专利权人: 国网河北省电力有限公司,国网河北省电力有限公司雄安新区供电公司
- 当前专利权人: 国网河北省电力有限公司,国网河北省电力有限公司雄安新区供电公司
- 当前专利权人地址: 河北省石家庄市富强大街32号;
- 代理机构: 石家庄新世纪专利商标事务所有限公司
- 代理商 齐兰君; 杨钦祥
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V30/19 ; G06V10/82 ; G06N3/0464
摘要:
本发明公开了一种基于核尺度扩张的文本检测方法,涉及文本检测技术领域,尤其是一种文本检测方法,包括如下步骤:通过ResNet18网络对图片提取特征;通过FPN网络对所述ResNet18网络提取的所述特征提取深层语义信息并将提取的所述深层语义信息以及提取的所述特征进行融合产生融合特征;对所述融合特征提取不同尺度的文本中心核以及提取全局特征;利用区域权重算法对所述不同尺度的文本中心核以及所述全局特征进行区域融合得到最终的检测结果。本发明主要针对自然场景下中的复杂文本内容进行检测。通过基于分割的思想对文本预测多种核来避免常见的粘连问题,同时全局特征的使用进一步修正来生成的区域。该方法能够有效的解决复杂环境下的文本检测问题。
公开/授权文献
- CN113159020A 基于核尺度扩张的文本检测方法 公开/授权日:2021-07-23