- 专利标题: 一种基于特征增强金字塔网络的场景文本检测方法
-
申请号: CN202210742861.1申请日: 2022-06-28
-
公开(公告)号: CN115131797B公开(公告)日: 2023-06-09
- 发明人: 明悦 , 孙娟娟 , 邓茜 , 钟倩文
- 申请人: 北京邮电大学
- 申请人地址: 北京市海淀区西土城路10号
- 专利权人: 北京邮电大学
- 当前专利权人: 北京邮电大学
- 当前专利权人地址: 北京市海淀区西土城路10号
- 代理机构: 北京市商泰律师事务所
- 代理商 黄晓军
- 主分类号: G06V30/26
- IPC分类号: G06V30/26 ; G06V30/19 ; G06V30/18 ; G06T7/136 ; G06T7/11 ; G06T3/40 ; G06N3/0464
摘要:
本发明提供了一种基于特征增强金字塔网络的场景文本检测方法。该方法包括:将待检测图像输入到特征增强金字塔网络,特征增强金字塔网络对待检测图像经过不同的卷积阶段生成不同尺度的特征图,将不同尺度的特征图进行拼接得到富含尺度信息的高级特征图;将高级特征图输入到通道注意力机制模块中,输出经过权重选择的各个通道权重不同的特征图;将经过权重选择的各个通道权重不同的特征图输入到后处理模块,后处理模块输出待检测图像的文本检测结果。本发明使用Res2Net与特征增强金字塔网络作为骨架网络,在特征金字塔网络的基础上新增下采样路径,只对邻近层进行采样后融合,使用通道注意力机制增强文本特征的权重,使算法检测到更加精确的文本边界。
公开/授权文献
- CN115131797A 一种基于特征增强金字塔网络的场景文本检测方法 公开/授权日:2022-09-30