-
公开(公告)号:CN111754439B
公开(公告)日:2024-01-12
申请号:CN202010599313.9
申请日:2020-06-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T5/77 , G06T11/40 , G06V10/44 , G06V10/56 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455
摘要: 本申请公开了图像处理的方法、装置、设备以及存储介质,涉及人工智能、深度学习、图像处理技术领域。实现方案为:将掩膜图像和第一图像输入编码网络;利用编码网络的各卷积层对第一图像下采样;至少一层卷积层通过输入本层的掩膜图像确定输入本层的第一图像进行卷积时每个卷积窗口的卷积核;将第二图像输入解码网络;利用解码网络的各反卷积层对第二图像上采样,并输出对目标区域进行填补后的图像。本申请实施例通过掩膜图像确定同一层中第一图像进行卷积时每个卷积窗口的卷积核,因此能够利用动态计算的卷积核更好地自适应不同卷积窗口中有效像素的特征提取,提高了特征提取的敏感度,从而使得最终对图像缺失区域的填补修复更加合理。
-
公开(公告)号:CN112561792B
公开(公告)日:2023-10-03
申请号:CN202011568994.9
申请日:2020-12-25
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T3/00 , G06T9/00 , G06N3/0464 , G06N3/08
摘要: 本公开提出一种图像风格迁移方法、装置、电子设备及存储介质,涉及计算机视觉和深度学习技术领域。具体实现方案为:生成内容图像的第一下采样图像、内容图像的拉普拉斯金字塔图像以及风格图像的第二下采样图像;利用第一下采样图像和第二下采样图像,生成初步风格迁移图像;对初步风格迁移图像进行上采样,得到第一上采样图像;将第一上采样图像中的数据与拉普拉斯金字塔图像中的数据进行组合,得到组合后的数据;对组合后的数据进行修正,得到修正后的图像;利用修正后的图像与初步风格迁移图像生成最终风格迁移图像。本公开实现的图像风格迁移能够达到较好的效果,且处理速度较快。
-
公开(公告)号:CN110647936B
公开(公告)日:2023-07-04
申请号:CN201910898183.6
申请日:2019-09-20
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06T3/40 , G06N3/045 , G06N3/08
摘要: 本申请公开了视频超分辨率重建模型的训练方法、装置和电子设备,涉及计算机视觉技术领域。具体实现方案为:获取多个样本数据,每一样本数据包括第一分辨率的样本视频和第二分辨率的样本视频,第二分辨率大于第一分辨率;建立视频超分辨率重建模型,视频超分辨率重建模型包括多个级别的神经网络子模块,第一级别的神经网络子模块的输入作为视频超分辨率重建模型的输入,非第一级别的神经网络子模块接收来自上一级的神经网络子模块所输出的特征数据;采用所述多个样本数据分别对各个级别的所述神经网络子模块进行训练。本申请有利于处理视频中的动态模糊,提高有利于提高视觉效果。
-
公开(公告)号:CN111275784B
公开(公告)日:2023-06-13
申请号:CN202010065575.7
申请日:2020-01-20
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T11/00 , G06V40/16 , G06N3/0464 , G06N3/0475 , G06N3/094
摘要: 本公开实施例公开了生成图像的方法和装置。方法包括:获取包括第一人脸的第一图像;将第一图像输入预先训练的生成式对抗网络,得到生成式对抗网络输出的包括第二人脸的第二图像;其中,生成式对抗网络将基于输入的图像生成的人脸属性信息作为约束。该方法可以提高生成式对抗网络基于输入的第一图像生成第二图像的准确率和效率,减少误生成图像的概率,并且减少了对输入的图像只能为预定区域内的图像的约束。
-
-
公开(公告)号:CN111669647A
公开(公告)日:2020-09-15
申请号:CN202010537321.0
申请日:2020-06-12
申请人: 北京百度网讯科技有限公司
IPC分类号: H04N21/4402 , G06K9/00 , G06K9/62
摘要: 本申请公开了一种实时视频的处理方法、装置、设备及存储介质,涉及数字图像处理、深度学习技术领域。具体实现方案为:将视频帧加入至视频帧集合中,并从视频帧集合中获取当前处理帧;将当前处理帧输入至人脸风格转换模型中,获取模型输出的第一类风格变换帧;以当前处理帧和第一类风格变换帧为起点,根据视频帧集合中设定数量的后续视频帧与前一视频帧中各人脸关键点间的位置关系,生成对应的第二类风格变换帧;从视频帧集合中获取新的当前处理帧后,返回执行将当前处理帧输入至人脸风格转换模型中的操作,并将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果。本申请实施例的技术方案可以基于视频中的真实人脸实时生成匹配的风格人脸。
-
公开(公告)号:CN111524166A
公开(公告)日:2020-08-11
申请号:CN202010320935.3
申请日:2020-04-22
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T7/269 , G06K9/62 , H04N21/44 , H04N21/234
摘要: 本申请公开了视频帧的处理方法和装置,涉及计算机视觉技术领域。具体实施方式包括:利用基于视频中相邻的在先帧和在后帧生成的光流,对所述在先帧的特征图进行转换,得到转换后特征图;基于该光流的误差,确定该转换后特征图的权重,以及基于该转换后特征图和该在后帧的特征图之间的特征的加权结果,得到融合特征图;更新该在后帧的特征图为该融合特征图。本申请利用在先帧的光流转换结果,来中和相邻视频帧之间对象的位置偏差,可以有效避免进行图像处理后在相邻视频帧之间的画面抖动。
-
公开(公告)号:CN110288513A
公开(公告)日:2019-09-27
申请号:CN201910441508.8
申请日:2019-05-24
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T3/00
摘要: 本公开涉及用于改变人脸属性的方法、装置、设备和存储介质。在一种方法中,从人脸的多个属性中选择将被改变的属性。基于人脸转换过程将原始人脸图像转换至目标人脸图像,目标人脸图像的属性和原始人脸图像的属性具有不同的值。基于一致性判断过程确定目标人脸图像的评分,评分指示目标人脸图像与人脸转换过程的目的相一致的程度。基于真实度判断过程确定目标人脸图像的真实度等级,真实度等级描述目标人脸图像为真实图像的可能性。基于评分和真实度等级,更新人脸转换过程、一致性判断过程和真实度判断过程。采用上述实现方式,可以以更为有效的方式确定用于改变人脸属性的转换过程,并使得转换后的图像更为逼真。
-
公开(公告)号:CN110148202A
公开(公告)日:2019-08-20
申请号:CN201910340395.2
申请日:2019-04-25
申请人: 北京百度网讯科技有限公司
摘要: 本公开涉及用于生成图像的方法、装置、设备和存储介质。在一种方法中,获取目标动作图像,目标动作图像包括由人物执行目标动作的图像。获取动作视频,动作视频包括由目标人物执行一组动作的一组图像。基于相似性规则,从一组图像中选择目标输入图像,目标输入图像包括由目标人物执行一组动作中的一个动作的图像,动作与目标动作之间的相似性满足预定条件。根据动作模型中包括的输入图像、输出图像中的动作和输出图像之间的关联关系,生成与目标输入图像和目标动作相关联的目标输出图像,目标输出图像包括由目标人物执行目标动作的图像。采用上述实现方式,可以以更为有效的方式确定目标人物执行各种动作的图像,使得目标人物的动作更为自然。
-
公开(公告)号:CN110147737A
公开(公告)日:2019-08-20
申请号:CN201910340393.3
申请日:2019-04-25
申请人: 北京百度网讯科技有限公司
摘要: 本公开涉及用于生成视频的方法、装置、设备和存储介质。在一个方法中,获取包括用于生成视频的一组目标动作的动作视频,动作视频包括由人物执行一组目标动作的一组动作图像。从一组动作图像中,标识一组目标动作。根据目标人物的动作模型中包括的目标人物的动作、目标人物的目标人物图像与目标人物图像的目标蒙版之间的关联关系,分别确定与一组目标动作相关联的一组目标人物图像和一组目标人物图像的一组目标蒙版。基于一组目标人物图像和一组目标蒙版,生成包括由目标人物执行一组目标动作的视频。采用上述实现方式,可以以更为有效的方式确定目标人物的动作,使得目标人物的动作更为自然。
-
-
-
-
-
-
-
-
-