一种语音驱动的三维人脸动画生成方法及网络结构

    公开(公告)号:CN111724458B

    公开(公告)日:2023-07-04

    申请号:CN202010387250.0

    申请日:2020-05-09

    申请人: 天津大学

    IPC分类号: G06T13/40 G06T19/20

    摘要: 本发明属于计算机技术领域,具体涉及一种语音驱动的三维人脸动画生成方法,包括以下步骤:1)提取语音特征,并将该语音的身份信息嵌入到特征矩阵中;2)通过编码器将特征矩阵映射到低维空间,得到中间变量;3)利用解码器将中间变量映射到3D顶点位移的高维空间,对中间变量进行3D图形几何的约束,得到3D空间的位移量;4)根据获取的3D空间的位移量驱动模板模拟面部动画。与现有技术相比,本发明创新性地利用了3D几何图形特性来约束中间变量,通过引入非线性几何图形表示法和来自不同视角的两个约束条件,使得生成的3D面部表情更加生动形象。此外,本发明还提出了一种语音驱动的三维人脸动画生成网络结构。

    基于多列多尺度图卷积神经网络的3D人脸生成方法

    公开(公告)号:CN110728219B

    公开(公告)日:2023-09-26

    申请号:CN201910930936.7

    申请日:2019-09-29

    申请人: 天津大学

    摘要: 本发明属于计算机视觉和计算机图形学领域,为一种变分自编码器神经网络去学习3D人脸的高维表示,并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。本发明采取的技术方案是,基于多列多尺度图卷积神经网络的3D人脸生成方法,步骤如下:利用基于图卷积结构的多尺度变分编码器框架,将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量,然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh;其中,所述编码器包含三个部分,多尺度图卷积算法、选择融合、自注意力机制以及网络结构。本发明主要应用于图像处理。

    一种语音驱动的三维人脸动画生成方法及网络结构

    公开(公告)号:CN111724458A

    公开(公告)日:2020-09-29

    申请号:CN202010387250.0

    申请日:2020-05-09

    申请人: 天津大学

    IPC分类号: G06T13/40 G06T19/20

    摘要: 本发明属于计算机技术领域,具体涉及一种语音驱动的三维人脸动画生成方法,包括以下步骤:1)提取语音特征,并将该语音的身份信息嵌入到特征矩阵中;2)通过编码器将特征矩阵映射到低维空间,得到中间变量;3)利用解码器将中间变量映射到3D顶点位移的高维空间,对中间变量进行3D图形几何的约束,得到3D空间的位移量;4)根据获取的3D空间的位移量驱动模板模拟面部动画。与现有技术相比,本发明创新性地利用了3D几何图形特性来约束中间变量,通过引入非线性几何图形表示法和来自不同视角的两个约束条件,使得生成的3D面部表情更加生动形象。此外,本发明还提出了一种语音驱动的三维人脸动画生成网络结构。

    基于多列多尺度图卷积神经网络的3D人脸生成方法

    公开(公告)号:CN110728219A

    公开(公告)日:2020-01-24

    申请号:CN201910930936.7

    申请日:2019-09-29

    申请人: 天津大学

    IPC分类号: G06K9/00 G06N3/04 G06N3/08

    摘要: 本发明属于计算机视觉和计算机图形学领域,为一种变分自编码器神经网络去学习3D人脸的高维表示,并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。本发明采取的技术方案是,基于多列多尺度图卷积神经网络的3D人脸生成方法,步骤如下:利用基于图卷积结构的多尺度变分编码器框架,将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量,然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh;其中,所述编码器包含三个部分,多尺度图卷积算法、选择融合、自注意力机制以及网络结构。本发明主要应用于图像处理。