文本检测模型训练方法、文本检测方法、装置及电子设备

    公开(公告)号:CN118823787A

    公开(公告)日:2024-10-22

    申请号:CN202411272987.2

    申请日:2024-09-11

    发明人: 顾东豪

    IPC分类号: G06V30/14 G06V30/19

    摘要: 本申请实施例提供了文本检测模型训练方法、文本检测方法、装置及电子设备。文本检测模型训练方法包括:针对每个训练图像中的各文本区域,按照预设搜索目标在该文本区域对应的内缩距离范围内,搜索该文本区域对应的内缩距离;基于训练图像中的各文本区域对应的内缩距离对各文本区域进行内缩,得到训练图像的内缩图;对各文本区域进行外扩,得到各文本区域对应的外扩区域;生成各训练图像的分割图标签、阈值图标签和二值图标签;将训练图像输入待训练的文本检测模型,基于模型输出的预测概率图、预测阈值图以及预测二值图分别与分割图标签、阈值图标签以及二值图标签之间的差异进行训练,得到文本检测模型。从而提高文本检测模型的文本定位精确度。

    一种数据增强模型的训练方法、数据增强方法、及装置

    公开(公告)号:CN118710889A

    公开(公告)日:2024-09-27

    申请号:CN202411184316.0

    申请日:2024-08-27

    摘要: 本申请实施例提供了一种数据增强模型的训练方法、数据增强方法、及装置,涉及机器学习技术领域,该数据增强模型的训练方法包括:获取训练图像;利用初始结构的数据增强模型生成每一训练图像的数据增强变量的变量值;利用每一训练图像的数据增强变量的变量值,对该训练图像中对象的检测框进行变换处理,得到第一检测框;基于测试图像中表示同一类别对象的检测框,与表示该同一类别对象的第一检测框之间几何特征的差异,确定模型损失值;基于模型损失值对初始结构的数据增强模型的模型参数进行调参,直至达到预设收敛条件,得到训练完成的数据增强模型。通过本方案能够省去由专业人员人工调节超参数的过程,降低人工成本。