一种虚拟谈话数字人生成方法

    公开(公告)号:CN116402928A

    公开(公告)日:2023-07-07

    申请号:CN202310602029.6

    申请日:2023-05-26

    IPC分类号: G06T13/40

    摘要: 一种虚拟谈话数字人生成方法,包括:S1,基于获取的真实录像的谈话视频,通过编码器结合语音特征分离出身份特征和脸部表情特征;S2,将脸部表情特征编码到隐变量空间中,得到谈话视频中的每一帧图像对应的表情隐变量表示;S3,在得到表情隐变量表示后,通过基于注意力机制的Transformer神经网络拟合出谈话音频对应的表情隐变量;S4,解码器基于身份特征和谈话音频对应的表情隐变量生成谈话头像视频;S5,根据谈话视频中的音频特征从全身的身体动作库选取对应的动作组;S6,对谈话头像视频和动作组进行融合,得到全身的虚拟谈话数字人。本发明能够得到形象更加逼真、更接近现实生活中人物的谈话虚拟数字人。

    一种虚拟谈话数字人生成方法

    公开(公告)号:CN116402928B

    公开(公告)日:2023-08-25

    申请号:CN202310602029.6

    申请日:2023-05-26

    IPC分类号: G06T13/40

    摘要: 一种虚拟谈话数字人生成方法,包括:S1,基于获取的真实录像的谈话视频,通过编码器结合语音特征分离出身份特征和脸部表情特征;S2,将脸部表情特征编码到隐变量空间中,得到谈话视频中的每一帧图像对应的表情隐变量表示;S3,在得到表情隐变量表示后,通过基于注意力机制的Transformer神经网络拟合出谈话音频对应的表情隐变量;S4,解码器基于身份特征和谈话音频对应的表情隐变量生成谈话头像视频;S5,根据谈话视频中的音频特征从全身的身体动作库选取对应的动作组;S6,对谈话头像视频和动作组进行融合,得到全身的虚拟谈话数字人。本发明能够得到形象更加逼真、更接近现实生活中人物的谈话虚拟数字人。

    一种图片处理方法、系统及计算机

    公开(公告)号:CN116309032B

    公开(公告)日:2023-07-28

    申请号:CN202310587379.X

    申请日:2023-05-24

    摘要: 本发明提供一种图片处理方法、系统及计算机,方法包括:生成内容数据集及风格数据集;选取待测图片,获取其待测风格编码,基于待测风格编码获取有监督对比学习损失;选取待迁图片,将待迁图片转化为待定图片,根据待定图片获取内容损失及风格损失;结合有监督对比学习损失、内容损失及风格损失进行训练,获取最终编码器及最终解码器;获取全部的画作图片的风格编码,将风格编码映射为噪声;根据风格编码及噪声获取分布损失,获取最终条件可逆网络ccnf;以画作图片或画家名字为迁移条件,将基础图片转换为结果图片。通过上述步骤,实现多种迁移选择,画家风格迁移可分辨作画时差别,获取多样化的结果图片,解决多阈及多样化问题。

    一种图片处理方法、系统及计算机

    公开(公告)号:CN116309032A

    公开(公告)日:2023-06-23

    申请号:CN202310587379.X

    申请日:2023-05-24

    摘要: 本发明提供一种图片处理方法、系统及计算机,方法包括:生成内容数据集及风格数据集;选取待测图片,获取其待测风格编码,基于待测风格编码获取有监督对比学习损失;选取待迁图片,将待迁图片转化为待定图片,根据待定图片获取内容损失及风格损失;结合有监督对比学习损失、内容损失及风格损失进行训练,获取最终编码器及最终解码器;获取全部的画作图片的风格编码,将风格编码映射为噪声;根据风格编码及噪声获取分布损失,获取最终条件可逆网络ccnf;以画作图片或画家名字为迁移条件,将基础图片转换为结果图片。通过上述步骤,实现多种迁移选择,画家风格迁移可分辨作画时差别,获取多样化的结果图片,解决多阈及多样化问题。

    交互式图像编辑方法、装置、可读存储介质及电子设备

    公开(公告)号:CN113448477A

    公开(公告)日:2021-09-28

    申请号:CN202111008172.X

    申请日:2021-08-31

    摘要: 一种交互式图像编辑方法、装置、可读存储介质及电子设备,该方法包括:对原始图像进行属性特征提取,得到图像属性特征;对所述原始图像对应的描述性文本进行上下文语义的词嵌入与编码得到文本特征;对所述图像属性特征与文本特征进行融合,得到融合特征;提取所述原始图像的整体结构特征;将所述整体结构特征与所述融合特征做空间注意力融合处理,得到被编辑区域的修正结构特征;对被编辑区域的修正结构特征做非编辑区域的结构特征补全,得到修正后的整体结构特征;将修正后的整体结构特征输入至生成器中,以使所述生成器基于融合特征指导,生成与所述描述性文本匹配的图像。