一种图像检测模型训练方法、图像检测方法及装置

    公开(公告)号:CN118736383A

    公开(公告)日:2024-10-01

    申请号:CN202410922595.X

    申请日:2024-07-10

    摘要: 本发明实施例提供了一种图像检测模型训练方法、图像检测方法及装置,涉及图像处理技术领域。图像检测模型训练方法包括:获取第一样本图像、第一标签、第二样本图像和第二标签;融合第一样本图像和第二样本图像得到融合样本图像;从融合样本图像中确定对象所属的融合对象区域,并基于每一融合对象区域各自对应的样本对象区域的分类信息和样本对象区域所属的样本图像的融合权重,计算该融合对象区域的融合分类信息;基于融合样本图像和融合标签对初始结构的图像检测模型进行训练,得到训练好的图像检测模型。融合样本图像是基于第一样本图像和第二样本图像融合得到的难例样本,基于难例样本对图像检测模型进行训练得到的图像检测模型的准确性更高。

    图像处理方法、图像采集设备、装置、介质及产品

    公开(公告)号:CN118711026A

    公开(公告)日:2024-09-27

    申请号:CN202410810325.X

    申请日:2024-06-21

    摘要: 本发明提供了图像处理方法、图像采集设备、装置、介质及产品,涉及图像处理技术领域。方法包括:针对每一待处理图像帧,从待处理视频图像中确定该待处理图像帧对应的第一参考图像帧;将第一参考图像帧以及该待处理图像帧输入至图像处理网络,得到第一参考图像帧相对于该待处理图像帧的偏移量以及第一参考图像帧和该待处理图像帧各像素点的权重矩阵;基于第一参考图像帧相对于该待处理图像帧的偏移量,对第一参考图像帧进行映射,得到第一参考图像帧的映射结果;按照第一参考图像帧和该待处理图像帧各像素点的权重矩阵,将第一参考图像帧的映射结果与该待处理图像帧进行融合,得到该待处理图像帧增强后的图像帧。本发明可以提高图像质量。

    一种图像增强方法、装置、设备以及存储介质

    公开(公告)号:CN118608439A

    公开(公告)日:2024-09-06

    申请号:CN202310237175.3

    申请日:2023-03-03

    发明人: 汝佩哲 周晓

    IPC分类号: G06T5/92 G06V10/77 G06V10/80

    摘要: 本发明实施例提供了一种图像增强方法、装置、设备以及存储介质,涉及图像处理技术领域,具体实现方案为:获得反映待增强视频帧与同场景视频帧所对应的场景区域间相对位置的位置映射关系;其中,所述同场景视频帧为:视频中在所述待增强视频帧之前采集的视频帧和/或在所述待增强视频帧之后采集的视频帧;基于所得位置映射关系,确定同场景视频帧中第一像素点在所述待增强视频帧中对应的第二像素点;对每一第二像素点,对该第二像素点的像素值与该第二像素点对应的第一像素点的像素值进行融合,得到包含融合后的第二像素点的图像。应用本发明实施例提供的方案,能够提高视频帧的图像质量。

    并行卷积计算方法、装置、目标卷积模块及存储介质

    公开(公告)号:CN117993433A

    公开(公告)日:2024-05-07

    申请号:CN202211343997.1

    申请日:2022-10-31

    IPC分类号: G06N3/0464 G06N3/063

    摘要: 本发明实施例提供了一种并行卷积计算方法、装置、目标卷积模块及存储介质。方案如下:接收待处理数据;根据待处理数据对应的帧周期,以及目标卷积模块对应的输入通道数和输出通道数,计算待处理数据对应的循环处理周期和并行支路数;基于并行支路数,对预设卷积参数进行多项分解,得到第一卷积参数集;基于循环处理周期,从待处理数据中获取预设数量路量化数据;基于第一卷积参数集,按照Winograd算法,并行对预设数量路量化数据进行卷积计算,得到第二输出数据。通过本申请实施例提供的技术方案,通过对待处理数据的并行卷积计算,提高了待处理数据的卷积计算的效率,实现了硬件资源有限的情况下卷积计算高效性。

    图像去噪模型训练方法、图像去噪方法、装置及电子设备

    公开(公告)号:CN118195930A

    公开(公告)日:2024-06-14

    申请号:CN202211584782.9

    申请日:2022-12-09

    摘要: 本申请实施例提供了一种图像去噪模型训练方法、图像去噪方法、装置及电子设备,涉及图像处理技术领域,图像去噪模型训练方法中将样本数据中的每一噪声图像输入至待训练的图像去噪模型,得到预测图像;针对该噪声图像中的每一像素位置,若该像素位置在预测图像中的像素值位于第一像素值区间内,则基于该像素位置在预测图像中的像素值与第二像素值区间计算该像素位置处的损失值;基于利用各像素位置处的损失值计算得到的该噪声图像的损失值,调整待训练的图像去噪模型的模型参数,直至达到收敛条件,训练完成。基于此,在一定程度上避免图像去噪模型出现过拟合的现象,基于训练好的图像去噪模型对图像进行处理,可以提高去噪后的图像的图像质量。

    一种文本识别方法、装置、电子设备及存储介质

    公开(公告)号:CN117218638A

    公开(公告)日:2023-12-12

    申请号:CN202311173340.X

    申请日:2023-09-12

    摘要: 本发明实施例提供了一种文本识别方法、装置、电子设备及存储介质,涉及图像处理技术领域,方法包括:获取待识别图像;待识别图像中显示有文本内容;将待识别图像输入至预先训练的文本识别模型,得到文本识别模型输出的待识别图像中的各图像区域对应的概率矩阵;概率矩阵中的每一列向量与一个图像区域相对应;该向量中的元素包括:表示对应的图像区域不存在字符的概率第一元素,以及在对应的图像区域存在字符时,对应的图像区域中的字符为预设字符的概率的第二元素;基于待识别图像中的各图像区域对应的概率矩阵,得到待识别图像中的文本内容,可以避免用户操作繁琐的情况,并提高电子设备获取待识别图像中的文本内容的效率。

    一种图像生成方法、装置、电子设备及存储介质

    公开(公告)号:CN114494080A

    公开(公告)日:2022-05-13

    申请号:CN202210308798.0

    申请日:2022-03-28

    摘要: 本申请实施例提供了一种图像生成方法、装置、电子设备及存储介质。方案如下:获取图像采集设备在无光照条件下采集的第一图像;获取图像采集设备在第一环境光亮度下采集的第二图像,第一环境光亮度大于第一亮度阈值;针对第二图像中的每一像素点,将该像素点的第一像素值与预设数值的商确定为该像素点对应的第二像素值,得到第二图像在第二环境光亮度下对应的第三图像,第二环境光亮度小于第一亮度阈值;基于泊松分布,在第三图像中添加光子散粒噪声,得到第四图像;根据第一图像和第四图像,生成目标图像。通过本申请实施例提供的技术方案,降低了噪声模拟的复杂性,提高了噪声模拟的准确性,从而提高了生成的图像的准确性。