发明授权
CN107545262B 一种在自然场景图像中检测文本的方法及装置
失效 - 权利终止
- 专利标题: 一种在自然场景图像中检测文本的方法及装置
-
申请号: CN201710642311.1申请日: 2017-07-31
-
公开(公告)号: CN107545262B公开(公告)日: 2020-11-06
- 发明人: 王凯 , 陈院林 , 乔宇 , 贺通
- 申请人: 华为技术有限公司
- 申请人地址: 广东省深圳市龙岗区坂田华为总部办公楼
- 专利权人: 华为技术有限公司
- 当前专利权人: 华为技术有限公司
- 当前专利权人地址: 广东省深圳市龙岗区坂田华为总部办公楼
- 代理机构: 北京同达信恒知识产权代理有限公司
- 代理商 李志新
- 主分类号: G06K9/32
- IPC分类号: G06K9/32 ; G06K9/46 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
一种在自然场景图像中检测文本的方法及装置,用以解决现有技术中从不同复杂程度的自然场景图像中检测文本精度较低的问题。该方法包括:获取自然场景图像,通过FCN模型,对获取的自然场景图像进行卷积运算,得到自然场景图像的卷积特征,根据自然场景图像的卷积特征,确定自然场景图像中包括的文本候选区域序列,针对文本候选区域序列中的每一文本候选区域,执行:通过感兴趣区域池化层,提取文本候选区域的卷积特征,并通过特征变换,将文本候选区域的卷积特征,转化为固定维度k的特征向量,根据时间递归网络模型和固定维度k的特征向量,确定文本候选区域中包括的文本行的位置,其中k为正整数。
公开/授权文献
- CN107545262A 一种在自然场景图像中检测文本的方法及装置 公开/授权日:2018-01-05