- 专利标题: 一种基于级联神经网络的文字检测方法、装置及存储介质
-
申请号: CN202011238231.8申请日: 2020-11-09
-
公开(公告)号: CN112348015B公开(公告)日: 2022-11-18
- 发明人: 吴婷婷 , 汪泰伸 , 陈德意 , 吴志鹏 , 刘彩玲 , 高志鹏 , 赵建强
- 申请人: 厦门市美亚柏科信息股份有限公司
- 申请人地址: 福建省厦门市思明区软件园二期观日路12号102-402单元
- 专利权人: 厦门市美亚柏科信息股份有限公司
- 当前专利权人: 厦门市美亚柏科信息股份有限公司
- 当前专利权人地址: 福建省厦门市思明区软件园二期观日路12号102-402单元
- 代理机构: 厦门福贝知识产权代理事务所
- 代理商 陈远洋
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V10/22 ; G06V10/774 ; G06V10/764 ; G06V10/82 ; G06N3/04 ; G06N3/08 ; G06N5/04
摘要:
本发明公开了一种基于级联神经网络的文字检测方法、装置及存储介质,该方法通过收集样本,并对样本进行处理生成数据集;搭建第一全卷积网络,通过数据集对第一全卷积网络进行训练至网络收敛,并通过训练后的第一全卷积网络对数据集进行推理,获得回归结果;搭建第二全卷积网络,通过回归结果对第二全卷积网络进行训练至网络收敛;将待验证图片输入第一全卷积网络,若第一全卷积网络判断在滑窗范围内存在文字,则裁剪下滑窗范围内的区域做双线性插值尺度变换并输入第二全卷积网络,通过第二全卷积网络判断区域是否为文字区域。该方法具有更好的泛化性能,并能够在保证检测准确率与召回率的同时,降低模型大小,从而提升文字检测算法性能。
公开/授权文献
- CN112348015A 一种基于级联神经网络的文字检测方法、装置及存储介质 公开/授权日:2021-02-09