将虚拟人物用于视频自动生产的方法、系统和存储介质

    公开(公告)号:CN113259778A

    公开(公告)日:2021-08-13

    申请号:CN202110434256.3

    申请日:2021-04-22

    IPC分类号: H04N21/81 H04N21/43

    摘要: 本发明公开了一种将虚拟人物用于视频自动生产的方法、系统和存储介质。方法包括使用神经网络合成发音声音属性和讲解文稿,获得语音信息,生成虚拟人物,根据图像信息生成视频信息,将虚拟人物嵌入到视频信息中等步骤。嵌入了虚拟人物的视频信息被播放出来时,会同时显示出视频信息中所包含的图像信息,以及模拟真人朗读讲解文稿动作和播放出同步语音信息的虚拟人物,其显示效果是虚拟人物对作为背景的图像信息进行介绍,具有真人的唇形和语音匹配、表情丰富等特点,解决了现有技术中视频录制设备要求的限制、采用拼接的方案合成语音的不足以及无真人、虚拟动漫角色讲解的短板,可大幅度提高视频自动创作的效率。本发明广泛应用于多媒体技术领域。

    一种人物场景视频生成方法、系统、装置及存储介质

    公开(公告)号:CN111353069A

    公开(公告)日:2020-06-30

    申请号:CN202010079892.4

    申请日:2020-02-04

    摘要: 本发明公开了一种人物场景视频生成方法、系统、装置及存储介质,通过训练好生成对抗网络模型,并将带有限制条件的标签图像输入训练好的生成对抗网络模型中,从而可输出与限制条件对应的真人图片,限制条件可指导生成对抗网络模型生成与限制条件对应的真实图像,从而可对生成内容进行更加精细的内容控制,生成更加可控的高清图像。并且可根据后续使用中产生的新生成需求,增加新的限制条件,使生成内容根据需求扩展变得更加丰富;而且无需每段视频都必须有真实人物进行录制,具有更快的制作效率与更加丰富的扩展形式。本发明广泛应用于计算机技术领域。

    一种将文本转换成语音的方法、系统、装置和存储介质

    公开(公告)号:CN111145720A

    公开(公告)日:2020-05-12

    申请号:CN202010079855.3

    申请日:2020-02-04

    摘要: 本发明公开了一种将文本转换成语音的方法、系统、装置和存储介质,所述方法包括获取测试文本和待迁移语音,获取所述测试文本的发音编码,使用经过训练的语音风格编码器,获取所述待迁移语音的风格编码,将所述发音编码和风格编码进行拼接,以及使用语音解码器对所述拼接的结果进行解码从而获得语音等步骤。通过使用语音风格编码器,可以提取待迁移语音的风格,然后将其融入到测试文本的发音中,使得最终获得的语音具有与测试文本相同的内容,以及与待迁移语音相同的风格,实现从文本到具有一定风格的语音的转换。并且,本发明可以较低成本取得训练集,用于对所述语音风格编码器进行训练,从而降低使用成本。本发明广泛应用于语音数据技术领域。