-
公开(公告)号:CN116958185A
公开(公告)日:2023-10-27
申请号:CN202310766828.7
申请日:2023-06-27
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了图像处理方法、装置、介质及设备,涉及图像技术领域,该方法包括:获取待处理图像以及所述待处理图像中每个像素点的第一色彩数据;根据所述每个像素点的第一色彩数据,确定所述待处理图像的初始前景图像;将所述待处理图像和所述初始前景图像进行通道叠加,并输入至深度学习网络,进行边缘检测处理,得到目标边缘检测结果;所述目标边缘检测结果指示每个像素点是否为边缘像素点;基于所述目标边缘检测结果,对所述待处理图像进行分割,得到目标前景图像。本申请可以有效提升前景图像的边缘精细程度。
-
公开(公告)号:CN115359088B
公开(公告)日:2023-01-20
申请号:CN202211273017.5
申请日:2022-10-18
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种图像处理方法以及相关装置。本申请实施例可应用于人工智能、智慧交通、辅助驾驶等各种场景。其方法包括:首先,获取包括抠图目标待处理图像;接着,通过金字塔特征提取网络对待处理图像进行处理,得到M个特征图像;然后,通过第一目标分割网络对M个特征图像进行处理,得到第一图像;并且,通过第二目标分割网络对M个特征图像进行处理,得到第二图像;最后,根据第一图像及第二图像,生成包括抠图目标的目标抠图图像。本申请提供的方法通过两个不同的目标分割网络对待处理图像的M个特征图像进行目标分割,得到第一图像及第二图像,通过第一图像及第二图像生成目标抠图图像,提高了抠图结果的准确性及抠图结果的精细程度。
-
公开(公告)号:CN118071867B
公开(公告)日:2024-07-30
申请号:CN202410471563.2
申请日:2024-04-19
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06T11/00 , G06N3/0464 , G06N3/048 , G06N3/08 , G06T5/50 , G06V10/762
摘要: 本公开涉及一种将文本数据转换为图像数据的方法、训练神经网络模型的方法、将文本数据转换为图像数据的装置、电子设备及计算机可读存储介质。所述方法包括:基于所述文本数据,确定所述文本数据在潜在空间中的表示;基于所述文本数据在潜在空间中的表示,确定所述文本数据对应的第一图像数据在潜在空间中的表示;以及基于所述文本数据对应的第一图像数据在潜在空间中的表示,确定所述第一图像数据以及第二图像数据,所述第二图像数据指示所述第一图像数据的背景区域。本公开实施例大幅降低了获取抠图数据的成本,能快速生成目标对象对应的图像数据,且该图像数据具有纯色背景或被快速转换成无背景的图像数据。
-
公开(公告)号:CN115359088A
公开(公告)日:2022-11-18
申请号:CN202211273017.5
申请日:2022-10-18
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种图像处理方法以及相关装置。本申请实施例可应用于人工智能、智慧交通、辅助驾驶等各种场景。其方法包括:首先,获取包括抠图目标待处理图像;接着,通过金字塔特征提取网络对待处理图像进行处理,得到M个特征图像;然后,通过第一目标分割网络对M个特征图像进行处理,得到第一图像;并且,通过第二目标分割网络对M个特征图像进行处理,得到第二图像;最后,根据第一图像及第二图像,生成包括抠图目标的目标抠图图像。本申请提供的方法通过两个不同的目标分割网络对待处理图像的M个特征图像进行目标分割,得到第一图像及第二图像,通过第一图像及第二图像生成目标抠图图像,提高了抠图结果的准确性及抠图结果的精细程度。
-
公开(公告)号:CN118115622B
公开(公告)日:2024-08-16
申请号:CN202410518163.2
申请日:2024-04-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06T11/00 , G06V10/40 , G06F40/284 , G06V10/774 , G06F18/214 , G06F40/30 , G06N3/0455 , G06N3/0464 , G06N3/082
摘要: 本申请实施例提供了一种图像生成模型的处理方法、装置、设备、存储介质及产品,该方法包括:获取包含多个对象的训练图像和训练图像对应的训练文本;从训练图像提取图像特征和各个对象的掩膜图像,从训练文本提取各个对象的文本特征;根据图像特征和各个对象的文本特征生成各个对象的注意力图像;根据训练图像、训练文本、各个对象的注意力图像和各个对象的掩膜图像的损失数据,对参考图像生成模型进行训练,得到目标图像生成模型。本申请实施例的技术方案可以在对模型的训练过程中,生成多个对象的注意力图像,并与多个对象的掩膜图像构建损失数据,有利于训练模型将文本中的实体词与图像中的对象对应,提高模型生成包含多个对象的图像的准确性。
-
公开(公告)号:CN118115622A
公开(公告)日:2024-05-31
申请号:CN202410518163.2
申请日:2024-04-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06T11/00 , G06V10/40 , G06F40/284 , G06V10/774 , G06F18/214 , G06F40/30 , G06N3/0455 , G06N3/0464 , G06N3/082
摘要: 本申请实施例提供了一种图像生成模型的处理方法、装置、设备、存储介质及产品,该方法包括:获取包含多个对象的训练图像和训练图像对应的训练文本;从训练图像提取图像特征和各个对象的掩膜图像,从训练文本提取各个对象的文本特征;根据图像特征和各个对象的文本特征生成各个对象的注意力图像;根据训练图像、训练文本、各个对象的注意力图像和各个对象的掩膜图像的损失数据,对参考图像生成模型进行训练,得到目标图像生成模型。本申请实施例的技术方案可以在对模型的训练过程中,生成多个对象的注意力图像,并与多个对象的掩膜图像构建损失数据,有利于训练模型将文本中的实体词与图像中的对象对应,提高模型生成包含多个对象的图像的准确性。
-
公开(公告)号:CN118071867A
公开(公告)日:2024-05-24
申请号:CN202410471563.2
申请日:2024-04-19
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06T11/00 , G06N3/0464 , G06N3/048 , G06N3/08 , G06T5/50 , G06V10/762
摘要: 本公开涉及一种将文本数据转换为图像数据的方法、训练神经网络模型的方法、将文本数据转换为图像数据的装置、电子设备及计算机可读存储介质。所述方法包括:基于所述文本数据,确定所述文本数据在潜在空间中的表示;基于所述文本数据在潜在空间中的表示,确定所述文本数据对应的第一图像数据在潜在空间中的表示;以及基于所述文本数据对应的第一图像数据在潜在空间中的表示,确定所述第一图像数据以及第二图像数据,所述第二图像数据指示所述第一图像数据的背景区域。本公开实施例大幅降低了获取抠图数据的成本,能快速生成目标对象对应的图像数据,且该图像数据具有纯色背景或被快速转换成无背景的图像数据。
-
公开(公告)号:CN116664603B
公开(公告)日:2023-12-12
申请号:CN202310951070.4
申请日:2023-07-31
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种图像处理方法、装置、电子设备及存储介质。本申请的实施例涉及人工智能的机器学习以及云技术等技术领域。该方法包括:将预分割掩膜以及所述绿幕图像融合,得到合成图像;从所述合成图像中确定包括目标部位的目标区域;对所述目标区域中的驱动部位进行驱动,以得到驱动图像;根据所述驱动图像的像素和所述背景区域的像素,提取驱动后的目标部位;根据所述驱动后的目标部位和所述前景区域中除所述目标部位以外的区域,得到目标前景区域。本申请中,利用驱动图像的像素和背景区域的像素,提取驱动图像中与目标部位对应的驱动后的目标部位,提高了分割出的目标前景区域的准确率以及分割效果。
-
公开(公告)号:CN116664603A
公开(公告)日:2023-08-29
申请号:CN202310951070.4
申请日:2023-07-31
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种图像处理方法、装置、电子设备及存储介质。本申请的实施例涉及人工智能的机器学习以及云技术等技术领域。该方法包括:将预分割掩膜以及所述绿幕图像融合,得到合成图像;从所述合成图像中确定包括目标部位的目标区域;对所述目标区域中的驱动部位进行驱动,以得到驱动图像;根据所述驱动图像的像素和所述背景区域的像素,提取驱动后的目标部位;根据所述驱动后的目标部位和所述前景区域中除所述目标部位以外的区域,得到目标前景区域。本申请中,利用驱动图像的像素和背景区域的像素,提取驱动图像中与目标部位对应的驱动后的目标部位,提高了分割出的目标前景区域的准确率以及分割效果。
-
-
-
-
-
-
-
-