一种融合空洞卷积的快速场景文本检测方法

    公开(公告)号:CN114529894A

    公开(公告)日:2022-05-24

    申请号:CN202210046573.2

    申请日:2022-01-14

    Abstract: 本发明公开了一种融合空洞卷积的快速场景文本检测方法,包括获取文本检测训练数据集,并对训练数据集进行标签生成;建立融合空洞卷积的快速场景文本检测初步模型;所述融合空洞卷积的快速场景文本检测初步模型包括轻量级特征提取模块、空洞卷积模块和可微分二值化模块;使用标签生成的训练数据集对建立的融合空洞卷积的快速场景文本检测初步模型,并使用损失函数计算损失值以调整所述初步模型的参数得到融合空洞卷积的快速场景文本检测模型;采用融合空洞卷积的快速场景文本检测模型对场景中文本进行检测。本发明利用轻量级的神经网络替换大型网络用于提取输入图形的特征,降低的网络模型参数量,可以有效的提高文本检测网络模型的效率。同时为了弥补轻量级神经网络提取特征不足的问题,在特征融合层增加空洞卷积模块并使用通道注意力机制对特征进行融合筛选,提高了网络中特征的利用效率。因此本发明在保持较高文本检测水平的情况下,实现场景文本的快速检测。

    一种基于增强特征金字塔网络的任意形状场景文本检测方法

    公开(公告)号:CN114387610A

    公开(公告)日:2022-04-22

    申请号:CN202210042376.3

    申请日:2022-01-14

    Abstract: 本发明公开了一种基于增强特征金字塔网络的任意形状场景文本检测方法,该方法包括如下模块:特征提取模块,用于提取输入图像的特征;比率不变特征增强模块,用于语义信息的增强;重构空间分辨率模块,用于空间信息的增强;特征融合模块,用于将语义信息增强的特征和空间信息增强的特征进行融合,生成多个不同比例的分割结果;渐近扩展模块,作为后处理模块采用渐近扩展算法将特征融合模块生成的多个不同尺度的分割结果进行逐步扩展融合,得到最终的文本检测结果。本发明通过融合增强语义信息的特征和增强空间信息的特征,加深了文本检测模型对输入图像的理解,提高文本的检测精度;后处理模块采用渐近尺度扩展算法对不同尺度的分割图从小到大依次进行扩展,在有效预测场景文本真实形状的同时还能很好的区分开距离较近的文本实例,从而可以实现对任意形状场景文本的检测。

Patent Agency Ranking