检测模型训练方法以及目标检测方法

    公开(公告)号:CN115578552A

    公开(公告)日:2023-01-06

    申请号:CN202211304758.5

    申请日:2022-10-24

    IPC分类号: G06V10/24 G06V10/25

    摘要: 本说明书实施例提供检测模型训练方法以及目标检测方法,其中所述检测模型训练方法包括:获取标注有目标框的样本图像;将所述样本图像输入预设检测模型中进行目标检测,获得预测框;根据所述目标框的边信息和点信息,以及所述预测框的边信息和点信息,计算损失值;基于所述损失值调整所述预设检测模型的模型参数,返回执行所述获取标注有目标框的样本图像的步骤,在达到预设训练停止条件的情况下,确定训练后的所述预设检测模型为目标检测模型。通过边信息和点信息确定损失值,提高了模型检测的精确度。本方法实现简单,适用于使用任何深度学习框架,避免了方形物体无法回归的问题。

    图像表格的结构化方法及图像表格结构化模型的训练方法

    公开(公告)号:CN115457582A

    公开(公告)日:2022-12-09

    申请号:CN202210970486.6

    申请日:2022-08-12

    IPC分类号: G06V30/413 G06V30/19

    摘要: 本说明书提供了一种图像表格的结构化方法及图像表格结构化模型的训练方法,所述方法包括:在所述图像中设置多条虚拟锚线,对所述图像进行特征提取,以得到所述图像对应的特征图,针对每条虚拟锚线生成对应的特征向量,对所述多条虚拟锚线对应的特征向量进行回归处理,以确定出匹配于所述待识别表格的表格线的目标虚拟锚线,以及根据所述目标虚拟锚线对应的特征向量所生成的回归坐标,所述回归坐标为所述待识别表格的表格线在所述图像中的坐标,根据生成的回归坐标,生成所述待识别表格对应的结构化表格。

    一种文本检测模型的训练方法、装置、设备及介质

    公开(公告)号:CN116189205A

    公开(公告)日:2023-05-30

    申请号:CN202310210795.8

    申请日:2023-02-28

    摘要: 本说明书公开了一种文本检测模型的训练方法、装置、设备及介质,包括:将前景图像映射至背景图像得到合成图像,并对合成图像标注映射位置,前景图像为文本图像,背景图像为非文本图像。选取合成图像构建样本图像集,样本图像标注的映射位置为中文本信息位置。基于第一神经网络按照标注的中文本信息位置对第一样本图像进行特征提取,得到第一特征向量,并基于第二神经网络按照标注的中文本信息位置对第二样本图像进行特征提取,得到第二特征向量,第一神经网络和第二神经网络与文本检测模型的参数耦合。根据第一样本图像和第二样本图像是否为同一样本分类,以及第一特征向量和第二特征向量间的相似度确定训练损失,以对文本检测模型进行参数调整。