专利检索 ap:("天津大学") AND inv:"刘景瑛" 第 1 页

1.

发明授权
一种语音驱动的三维人脸动画生成方法及网络结构有权

公开(公告)号：CN111724458B

公开(公告)日：2023-07-04

申请号：CN202010387250.0

申请日：2020-05-09

申请人： 天津大学

发明人： 李坤 , 刘云珂 , 刘景瑛 , 惠彬原

IPC分类号： G06T13/40 , G06T19/20

摘要： 本发明属于计算机技术领域，具体涉及一种语音驱动的三维人脸动画生成方法，包括以下步骤：1)提取语音特征，并将该语音的身份信息嵌入到特征矩阵中；2)通过编码器将特征矩阵映射到低维空间，得到中间变量；3)利用解码器将中间变量映射到3D顶点位移的高维空间，对中间变量进行3D图形几何的约束，得到3D空间的位移量；4)根据获取的3D空间的位移量驱动模板模拟面部动画。与现有技术相比，本发明创新性地利用了3D几何图形特性来约束中间变量，通过引入非线性几何图形表示法和来自不同视角的两个约束条件，使得生成的3D面部表情更加生动形象。此外，本发明还提出了一种语音驱动的三维人脸动画生成网络结构。

2.

发明授权
基于多列多尺度图卷积神经网络的3D人脸生成方法有权

公开(公告)号：CN110728219B

公开(公告)日：2023-09-26

申请号：CN201910930936.7

申请日：2019-09-29

申请人： 天津大学

发明人： 李坤 , 刘景瑛 , 杨敬钰

IPC分类号： G06V20/64 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/08

摘要： 本发明属于计算机视觉和计算机图形学领域，为一种变分自编码器神经网络去学习3D人脸的高维表示，并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。本发明采取的技术方案是，基于多列多尺度图卷积神经网络的3D人脸生成方法，步骤如下：利用基于图卷积结构的多尺度变分编码器框架，将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量，然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh；其中，所述编码器包含三个部分，多尺度图卷积算法、选择融合、自注意力机制以及网络结构。本发明主要应用于图像处理。

3.

发明公开
一种语音驱动的三维人脸动画生成方法及网络结构审中-实审

公开(公告)号：CN111724458A

公开(公告)日：2020-09-29

申请号：CN202010387250.0

申请日：2020-05-09

申请人： 天津大学

发明人： 李坤 , 刘云珂 , 刘景瑛 , 惠彬原

IPC分类号： G06T13/40 , G06T19/20

摘要： 本发明属于计算机技术领域，具体涉及一种语音驱动的三维人脸动画生成方法，包括以下步骤：1)提取语音特征，并将该语音的身份信息嵌入到特征矩阵中；2)通过编码器将特征矩阵映射到低维空间，得到中间变量；3)利用解码器将中间变量映射到3D顶点位移的高维空间，对中间变量进行3D图形几何的约束，得到3D空间的位移量；4)根据获取的3D空间的位移量驱动模板模拟面部动画。与现有技术相比，本发明创新性地利用了3D几何图形特性来约束中间变量，通过引入非线性几何图形表示法和来自不同视角的两个约束条件，使得生成的3D面部表情更加生动形象。此外，本发明还提出了一种语音驱动的三维人脸动画生成网络结构。

4.

发明公开
基于多列多尺度图卷积神经网络的3D人脸生成方法审中-实审

公开(公告)号：CN110728219A

公开(公告)日：2020-01-24

申请号：CN201910930936.7

申请日：2019-09-29

申请人： 天津大学

发明人： 李坤 , 刘景瑛 , 杨敬钰

IPC分类号： G06K9/00 , G06N3/04 , G06N3/08

摘要： 本发明属于计算机视觉和计算机图形学领域，为一种变分自编码器神经网络去学习3D人脸的高维表示，并同时完成重建任务。利用变分自编码器的生成能力来生成更具有多样性的3D人脸数据。本发明采取的技术方案是，基于多列多尺度图卷积神经网络的3D人脸生成方法，步骤如下：利用基于图卷积结构的多尺度变分编码器框架，将输入的面部三维网格Mesh通过多尺度编码器编码到一个固定维度的中间向量，然后再通过使用解码器就将中间特征向量解析成原始的面部Mesh；其中，所述编码器包含三个部分，多尺度图卷积算法、选择融合、自注意力机制以及网络结构。本发明主要应用于图像处理。