一种语音驱动的三维人脸动画生成方法及网络结构

发明授权

CN111724458B 一种语音驱动的三维人脸动画生成方法及网络结构有权

请登陆查看更多内容

专利标题： 一种语音驱动的三维人脸动画生成方法及网络结构
申请号： CN202010387250.0

申请日： 2020-05-09
公开(公告)号： CN111724458B

公开(公告)日： 2023-07-04
发明人: 李坤 , 刘云珂 , 刘景瑛 , 惠彬原
申请人： 天津大学
申请人地址： 天津市南开区卫津路92号
专利权人： 天津大学
当前专利权人： 天津大学
当前专利权人地址： 天津市南开区卫津路92号
代理机构： 天津市北洋有限责任专利代理事务所
代理商 潘俊达
主分类号： G06T13/40
IPC分类号： G06T13/40 ; G06T19/20

摘要：

本发明属于计算机技术领域，具体涉及一种语音驱动的三维人脸动画生成方法，包括以下步骤：1)提取语音特征，并将该语音的身份信息嵌入到特征矩阵中；2)通过编码器将特征矩阵映射到低维空间，得到中间变量；3)利用解码器将中间变量映射到3D顶点位移的高维空间，对中间变量进行3D图形几何的约束，得到3D空间的位移量；4)根据获取的3D空间的位移量驱动模板模拟面部动画。与现有技术相比，本发明创新性地利用了3D几何图形特性来约束中间变量，通过引入非线性几何图形表示法和来自不同视角的两个约束条件，使得生成的3D面部表情更加生动形象。此外，本发明还提出了一种语音驱动的三维人脸动画生成网络结构。

公开/授权文献

CN111724458A 一种语音驱动的三维人脸动画生成方法及网络结构公开/授权日：2020-09-29

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06T	一般的图像数据处理或产生
G06T13/00	动画制作
G06T13/20	.3D〔三维〕动画
G06T13/40	..关于角色的，例如：人类、动物或虚幻人物