基于深度学习的场景文本检测方法、系统及装置

    公开(公告)号:CN116682121A

    公开(公告)日:2023-09-01

    申请号:CN202310542156.1

    申请日:2023-05-12

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于深度学习的场景文本检测方法、系统及装置,包括:S1、获取文本检测训练数据集;S2、对训练数据集图片进行数据增强;S3、对数据增强后的训练数据集图像进行随机中心裁剪得到随机中心剪裁训练数据集图像;S4、建立场景文本检测模型;S5、将随机中心剪裁训练数据集图像输入场景文本检测模型进行训练,得到训练后的场景文本检测模型;S6、将测试集输入训练后的场景文本检测模型进场景文本检测;S7、对文本检测结果进行评价。本发明可以实现场景文本检测且效率高。

    基于深度学习的光学字符分割方法及装置

    公开(公告)号:CN116597448A

    公开(公告)日:2023-08-15

    申请号:CN202310556314.9

    申请日:2023-05-16

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于深度学习的光学字符分割方法及装置,其中,该方法包括:获得训练数据集和调试数据集;使用Pytorch深度学习框架建立一个基于注意力机制的多尺度分割网络;使用训练数据集对所述多尺度分割网络进行训练,并使用调试数据集对训练后的多尺度分割网络进行微调;根据评价指标对多尺度分割网络的字符分割结果进行评价。

Patent Agency Ranking