-
公开(公告)号:CN112150489A
公开(公告)日:2020-12-29
申请号:CN202011023355.4
申请日:2020-09-25
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种图像的风格转换方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域。具体实现方案为:检测待处理的图像中是否包括人脸;若包括,采用预训练的人脸风格转换模型和预设的风格图,对待处理的图像中的人脸区域进行风格转换,使得风格转换后的人脸区域仅携带风格图中的颜色信息,而不包括风格图中的纹理信息;采用预训练的图像风格转换模型和预设的风格图,对待处理的图像中的人脸区域之外的其他区域进行风格转换。本申请的方案,能够在待处理的图像中包括人脸的时候,对人脸区域和其他区域进行不同的风格转换,能够有效地保证人脸区域的清晰度,提高图像风格转换的质量。
-
公开(公告)号:CN111507914A
公开(公告)日:2020-08-07
申请号:CN202010280026.1
申请日:2020-04-10
申请人: 北京百度网讯科技有限公司
摘要: 本申请实施例公开了一种人脸修复模型的训练方法、修复方法、装置、设备和介质,涉及图像处理技术领域,尤其涉及基于人工智能的人脸修复技术。具体实现方案为:获取第一画质人脸图像和第二画质人脸图像的样本对,样本对的第二画质人脸图像作为监督图像;将样本对的第一画质人脸图像输入人脸修复模型进行训练;基于至少两个损失函数,分别计算人脸修复模型的输出图像与监督图像之间的至少两种损失关系;如果确定至少两种损失关系不满足设定收敛要求,则调整人脸修复模型的模型参数并继续进行训练,直至确定至少两种损失关系满足设定收敛要求,则确定人脸修复模型训练完成。通过样本对和至少两个损失函数训练人脸修复模型,提高人脸修复的精确性。
-
公开(公告)号:CN111340905A
公开(公告)日:2020-06-26
申请号:CN202010089984.0
申请日:2020-02-13
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种图像风格化方法、装置、设备和介质,涉及图像渲染技术。具体实现方案为:获取训练样本图像,其中,所述训练样本图像包括待风格化图像集合,以及风格参考图;利用所述训练样本图像,对构建的图像风格化网络模型进行训练,其中,所述图像风格化网络模型包括内容特征提取网络和图像边缘提取网络,所述图像风格化网络模型的损失函数包括内容损失、边缘损失和风格损失;利用训练好的图像风格化网络模型,对任意待风格化的目标图像进行处理,得到与所述目标图像对应的风格化图像。本申请实施例通过在模型中增加边缘约束,避免了输出图像中因产生多余的纹理而造成图像不自然、影响艺术视觉效果的问题,提高图像风格化质量。
-
公开(公告)号:CN110648293A
公开(公告)日:2020-01-03
申请号:CN201910891323.7
申请日:2019-09-19
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了图像修复方法及装置,涉及计算机技术领域,尤其涉及图像处理。具体实现方案为:采用第一卷积神经网络的编码层对待修复图像进行编码,获得第一高维隐层向量;采用所述第一卷积神经网络的解码层对所述第一高维隐层向量进行解码,获得第二高维隐层向量;将所述第二高维隐层向量加入第三高维隐层向量中,采用第二卷积神经网络的解码层对所述第三高维隐层向量进行解码,获得第四高维隐层向量;所述第三高维隐层向量为所述第二卷积神经网络的编码层对所述待修复图像进行编码获得的;根据所述第四高维隐层向量,获得修复的图像。本申请实施例能够提高图像修复的准确性。
-
公开(公告)号:CN110636331A
公开(公告)日:2019-12-31
申请号:CN201910919234.9
申请日:2019-09-26
申请人: 北京百度网讯科技有限公司
IPC分类号: H04N21/234 , H04N21/2343
摘要: 本公开实施例公开了用于处理视频的方法和装置。该方法的一具体实施方式包括:对于所获取的原始视频中的视频帧,执行以下处理操作:将该视频帧转化为LAB模式,得到该视频帧的L通道、A通道和B通道;根据上述L通道的原始值确定更新值,得到亮度更新图像;对上述L通道进行边缘提取,得到边缘图像;分别对上述A通道和上述B通道的原始值进行处理,得到针对上述A通道的第一图像和针对上述B通道的第二图像;基于上述亮度更新图像、上述边缘图像、上述第一图像和上述第二图像得到RGB图像;基于得到的RGB图像生成视频,以及将所生成的视频输出。该实施方式实现了原始视频向漫画风格的视频的转换。
-
公开(公告)号:CN110277099A
公开(公告)日:2019-09-24
申请号:CN201910512255.9
申请日:2019-06-13
申请人: 北京百度网讯科技有限公司
摘要: 本发明实施例提供一种基于语音的嘴型生成方法和装置,属于深度学习领域。该方法包括:获取所述语音;根据所述语音以及训练后的时间卷积网络,得到嘴部关键点坐标序列;根据所述嘴部关键点坐标序列得到所述嘴型。该基于语音的嘴型生成方法和装置可以并行处理多条语音,提高处理效率。
-
公开(公告)号:CN110166650A
公开(公告)日:2019-08-23
申请号:CN201910355708.1
申请日:2019-04-29
申请人: 北京百度网讯科技有限公司
IPC分类号: H04N5/222 , H04N5/262 , H04N5/265 , H04N21/845
摘要: 本发明提供一种视频集的生成方法及装置、计算机设备与可读介质。其方法包括:基于预先建立的知识图谱,获取指定实体相关的多个视频;根据预先训练的动作检测模型,从所述多个视频中剪辑包含指定动作的多个视频片段;将包含所述指定动作的所述多个视频片段拼接在一起,得到所述视频集。本发明的通过采用上述技术方案,提供一种高效地、自动生成视频集的方案。本发明的技术方案,基于知识图谱和AI生成视频集,能够有效地保证剪辑的视频片段的准确性和生成的视频集的精度,且生成过程不需要人工手动参与剪辑,视频集的生成效率非常高。
-
公开(公告)号:CN110148158A
公开(公告)日:2019-08-20
申请号:CN201910395584.X
申请日:2019-05-13
申请人: 北京百度网讯科技有限公司
摘要: 根据本公开的示例实施例,提供了用于处理视频的方法、装置、设备和计算机可读存储介质。用于处理视频的方法包括利用参考点检测模型来确定训练视频中的训练对象的参考点在训练帧中的第一位置。该方法还包括基于训练帧和在训练帧之前的包括参考点的关联帧,确定参考点在训练帧中的第二位置。该方法进一步包括基于第一位置和第二位置,更新参考点检测模型。以此方式,能够稳定且高效地检测视频中的对象的参考点,从而提高相关应用场景中的用户体验。
-
公开(公告)号:CN112652057B
公开(公告)日:2024-05-07
申请号:CN202011621722.0
申请日:2020-12-30
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了生成人体三维模型的方法、装置、设备以及存储介质,涉及人工智能技术领域,具体为深度学习和计算机视觉领域。该方法的一具体实施方式包括:接收单张人体图像,提取人体图像对应的SMPL人体三维模型和PIFu人体三维模型;将SMPL人体三维模型和PIFu人体三维模型进行匹配,得到匹配结果;基于匹配结果,确定与PIFu人体三维模型的顶点最接近的SMPL人体三维模型的顶点,得到PIFu人体三维模型的顶点和SMPL人体三维模型的各个骨骼点的绑定权重;输出可驱动人体三维模型。该实施方式降低了生成人体三维模型的成本,并提高了生成效率。
-
公开(公告)号:CN112270745B
公开(公告)日:2023-09-29
申请号:CN202011217111.X
申请日:2020-11-04
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种图像生成方法、装置、设备以及存储介质,涉及人工智能技术,尤其涉及计算机视觉、深度学习和三维重建技术领域。具体实现方案为:根据二维图像的全景分割结果和显著性检测结果,确定所述二维图像的主体区域和所述主体区域的语义标签;根据所述主体区域的语义标签,对所述二维图像的深度图的主体区域进行异常深度值修正;根据修正后的深度图和所述二维图像,生成三维图像。提高了图像生成效果,为三维图像的生成提供了一种新思路。
-
-
-
-
-
-
-
-
-