基于深度卷积神经网络的场景文本检测方法、系统及设备

    公开(公告)号:CN114724155B

    公开(公告)日:2024-09-06

    申请号:CN202210410471.4

    申请日:2022-04-19

    Abstract: 本发明公开了一种基于深度卷积神经网络的场景文本检测方法、系统及设备,首先将获取的场景文本图像,进行数据增强操作,得到预定大小的图像信息;接着将预处理后的图像信息输入深度卷积神经网络中,提取图像特征;然后采用协调注意力机制层将图像特征进行增强处理;最后将增强后的特征图,采用渐进尺度扩展层进行后处理,获得文本检测结果。本发明通过在ResNet50的骨干网络中引入校正卷积、通道注意力,于提取的特征图后引入协调注意力,有效地扩大了网络感受空间,避免了后续降维操作丢失更多的语义信息,降低了不同尺度的特征图自顶向下融合导致的特征图失真程度,使网络具有更准确的鉴别区域;通过平方Dice损失函数提升了文本检测的准确性和精确性。

Patent Agency Ranking