图像融合模型的训练方法、图像融合方法及电子设备

    公开(公告)号:CN113052025B

    公开(公告)日:2024-08-13

    申请号:CN202110270423.5

    申请日:2021-03-12

    IPC分类号: G06V40/16 G06V10/774 G06T5/50

    摘要: 本申请公开了一种图像融合模型的训练方法、图像融合方法及电子设备,属于计算机技术领域。其中,图像融合模型的训练方法包括:获取样本图像;接收第一用户作用于目标图像中的第一目标人脸图像上的第一输入,并基于所述第一输入构建标签数据集合,所述标签数据集合包括至少一个标签数据组,所述目标图像为所述样本图像中至少一张图像;基于所述至少一个标签数据组构建损失函数,并基于所述损失函数对图像融合模型进行训练,以得到训练后的图像融合模型;其中,所述损失函数包括正负样本监督信号的放大因子。本申请能够解决相关技术中对图像处理操作较为繁琐的问题。

    图像融合模型的训练方法、图像融合方法及电子设备

    公开(公告)号:CN113052025A

    公开(公告)日:2021-06-29

    申请号:CN202110270423.5

    申请日:2021-03-12

    IPC分类号: G06K9/00 G06K9/62 G06T5/50

    摘要: 本申请公开了一种图像融合模型的训练方法、图像融合方法及电子设备,属于计算机技术领域。其中,图像融合模型的训练方法包括:获取样本图像;接收第一用户作用于目标图像中的第一目标人脸图像上的第一输入,并基于所述第一输入构建标签数据集合,所述标签数据集合包括至少一个标签数据组,所述目标图像为所述样本图像中至少一张图像;基于所述至少一个标签数据组构建损失函数,并基于所述损失函数对图像融合模型进行训练,以得到训练后的图像融合模型;其中,所述损失函数包括正负样本监督信号的放大因子。本申请能够解决相关技术中对图像处理操作较为繁琐的问题。

    多媒体通用模板生成方法、电子设备及存储介质

    公开(公告)号:CN112584061A

    公开(公告)日:2021-03-30

    申请号:CN202011548104.8

    申请日:2020-12-24

    摘要: 本发明公开了一种多媒体通用模板生成方法、电子设备及存储介质,方法包括:确定通用的文件封装结构;通用的文件封装结构包括:媒体文件和通用的描述文件;通用的描述文件包括:与多媒体通用模板中的各轨道分别对应的子描述文件,用于描述多媒体通用模板中相应轨道中媒体文件的封装状况;根据多媒体通用模板中与各轨道分别对应的子描述文件以及所述媒体文件,生成多媒体通用模板。本发明在进行通用模板生成时,采用轨道管理的方式确定多媒体通用模板各轨道中媒体文件的封装状况,从而能够比较清晰地对模板中出现的场景尤其是并行场景进行有效管理。本发明可以得到一种清晰有序的、通用的媒体素材封装技术标准,能够解决各家平台模板的兼容性问题。

    风格化图片生成方法、装置、设备及存储介质

    公开(公告)号:CN114897670A

    公开(公告)日:2022-08-12

    申请号:CN202210508195.5

    申请日:2022-05-11

    IPC分类号: G06T3/00 G06V10/40 G06V10/80

    摘要: 本发明公开了风格化图片生成方法、装置、设备及存储介质,该方法包括:确定待处理的目标图片对应的目标风格类型和属性特征向量,并根据属性特征向量确定目标图片对应的风格强度特征;提取目标图片的全局属性特征;根据目标风格类型查找预设风格特征库,得到目标风格类型匹配的风格特征;将全局属性特征、风格特征和风格强度特征进行拼接得到融合特征,并根据融合特征生成目标图片对应的风格化图片。本发明实现了风格化图片生成的多样性,使得目标图片中的目标对象与风格化图片的风格更加协调。

    动作关键点确定方法、装置、系统、电子设备及存储介质

    公开(公告)号:CN114863335A

    公开(公告)日:2022-08-05

    申请号:CN202210486843.1

    申请日:2022-05-06

    摘要: 本申请实施例提供一种动作关键点确定方法、装置、系统、电子设备及存储介质,涉及视频处理技术领域,以解决现有技术中动作关键点定位效率较低的问题。其中方法包括:将卷积特征图和对象关键点热力图进行帧内融合,以生成空域特征融合图,其中,所述卷积特征图通过对视频段逐帧进行卷积特征提取而生成,所述对象关键点热力图通过对所述视频段逐帧进行对象关键点检测而生成;将所述空域特征融合图沿着时序维度进行堆叠,以生成时空综合特征图;基于所述时空综合特征图和目标对象的时空检测框,生成所述目标对象的时空热力图;基于所述目标对象的时空热力图,确定所述视频段中所述目标对象的动作关键点的时间信息和位置信息。

    视频动画生成方法、装置、设备及存储介质

    公开(公告)号:CN114820889A

    公开(公告)日:2022-07-29

    申请号:CN202210447561.0

    申请日:2022-04-26

    摘要: 本发明公开了一种视频动画生成方法、装置、设备及存储介质,该方法包括:将去噪后的目标用户语音转换为纯净语音;根据目标用户语音的语音特征确定目标用户语音对应的特定原始语音;将纯净语音的语音特征、特定原始语音的语音特征和目标图像的图像特征进行融合,获得视频动画。由于本发明是通过将去噪后的目标用户语音转换为纯净语音,根据目标用户语音的语音特征确定对应的特定原始语音,再将纯净语音的语音特征、特定原始语音的语音特征和目标图像的图像特征融合生成视频动画,能够将输入语音中的噪音去除,并根据纯净语音、特定原始语音和目标图像生成视频动画,可以保证视频动画流畅平滑,提高了视频动画的质量。

    图像处理方法、装置及电子设备

    公开(公告)号:CN113033344B

    公开(公告)日:2024-04-12

    申请号:CN202110260415.2

    申请日:2021-03-10

    摘要: 本发明提供一种图像处理方法、装置及电子设备,该方法包括:获取多帧图像;将每帧图像中的各个人物映射至综合面部状态特征空间,得到每帧图像中各个人物的综合面部状态特征向量;根据每帧图像中各个人物的综合面部状态特征向量,计算每帧图像的合照面部状态和谐度,并选择合照面部状态和谐度最高的图像作为目标图像;从所有帧图像中为每个人物分别选取一帧图像上的人脸作为目标人脸融合源,将目标图像中目标人物的人脸替换为所述目标人物对应的目标人脸融合源;本发明实施例以每帧图像为维度,跨越不同人物选取最优人脸融合源,生成所有成员面部状态最一致的合照,激活人与人之间的关联关系对合照生成过程的驱动效果,令合照体验更和谐。