-
公开(公告)号:CN117541691A
公开(公告)日:2024-02-09
申请号:CN202311353471.6
申请日:2023-10-18
摘要: 本申请实施例提供了一种虚拟人驱动信息获取、驱动方法、电子设备以及存储介质,所述虚拟人驱动信息获取方法包括:获取视频中目标人物的面部信息,所述面部信息用于驱动虚拟人的面部表情与口型动作;获取视频中目标人物的躯体动作信息,所述躯体动作信息用于驱动虚拟人的躯体动作;确定相匹配的面部信息和躯体动作信息。与现有技术相比,通过在视频中提取目标人物的面部信息和躯体动作信息,获得虚拟人驱动信息。由于该过程不需要使用昂贵的动捕设备,也不需要耗费大量的人工操,因此成本相对较低。另外,在视频中提取的面部信息和躯体动作信息相匹配,可以保证驱动后虚拟人的面部表情、口型动作以及躯体动作统一且流畅,提高了用户体验。
-
公开(公告)号:CN117079672A
公开(公告)日:2023-11-17
申请号:CN202311111605.3
申请日:2023-08-31
发明人: 袁枫 , 阎志远 , 戴琳琳 , 景辉 , 王明哲 , 单杏花 , 李超 , 高志强 , 王心雨 , 随玉腾 , 李阳 , 衣帅 , 朱宇豪 , 李贝贝 , 吕占民 , 李杨 , 苗凡 , 李江涛
摘要: 本申请公开了一种用于虚拟交互的带情感语音合成方法,包括:将音素序列分别输入音素编码器和位置编码器中处理,将音素编码器和位置编码器的音素序列输出相加后送入编码器中进行编码,提取高维隐藏特征;将合成语音所需文本对应的虚拟形象视频流输入一虚拟形象编码器中处理,获取详细情感信息特征;将编码器和虚拟形象编码器的输出分别输入一方差适应器中进行合成计算,获得音素时长、音调、能量和情感的预测信息,并添加到音素隐藏序列中,输出嵌入情感特征的音素编码序列;将方差适应器和位置编码器的输出相加输入到解码器中进行计算后,输入声学模型中得到最终的带情感的合成语音。本申请还公开了一种用于虚拟交互的带情感语音合成系统。
-
公开(公告)号:CN308811823S
公开(公告)日:2024-08-30
申请号:CN202430037593.3
申请日:2024-01-19
申请人: 铁旅科技有限公司 , 北京经纬信息技术有限公司
摘要: 1.本外观设计产品的名称:玩偶(动物)。
2.本外观设计产品的用途:作为玩具、公仔或手办进行摆放、玩耍、收藏或装饰。
3.本外观设计产品的设计要点:在于形状与图案的结合。
4.最能表明设计要点的图片或照片:立体图。
5.省略仰视图和俯视图。
-
-