-
公开(公告)号:CN113592985B
公开(公告)日:2022-06-17
申请号:CN202110901418.X
申请日:2021-08-06
申请人: 宿迁硅基智能科技有限公司
摘要: 本申请实施例提供了一种混合变形值的输出方法及装置、存储介质、电子装置,所述方法包括:对获取的目标音频数据进行特征提取,得到目标音频特征向量;将目标音频特征向量和目标标识输入音频驱动动画模型;将目标音频特征向量输入包含多层卷积层的音频编码层,根据上一层t时刻和t‑n时刻之间的输入特征向量确定下一层(2t‑n)/2时刻的输入特征向量,将与上一层的输入特征向量有因果关系的特征向量确定为有效特征向量,依次根据每一层的有效特征向量输出目标音频编码特征,并将目标标识输入独热编码层进行二进制向量编码,得到目标标识编码特征;根据目标音频编码特征和目标标识编码特征,通过音频驱动动画模型输出目标音频数据对应的混合变形值。
-
公开(公告)号:CN114494538A
公开(公告)日:2022-05-13
申请号:CN202011270780.3
申请日:2020-11-13
申请人: 宿迁硅基智能科技有限公司
摘要: 本发明涉及动画数据处理领域,公开了一种语音驱动任意点面数的面部模型和面部模型动画迁移的方法及系统,其技术方案要点是预先生成样本人物语音与对应于头部三维扫描数据的三维点云数据的转化模型;输入任务语音到转化模型中得到任务三维点云数据;在目标三维面部模型上选择第一面部骨骼点,在任务三维点云数据选择与第一面部骨骼点的对应的运动数据;根据任务三维点云数据中的与第一面部骨骼点对应的运动数据,驱动目标三维面部模型上的第一面部骨骼点运动,并带动目标三维面部模型上所有顶点运动,能够提高面部动画的开发效率和可移植性。
-
公开(公告)号:CN114490958A
公开(公告)日:2022-05-13
申请号:CN202011270804.5
申请日:2020-11-13
申请人: 宿迁硅基智能科技有限公司
摘要: 本发明涉及人工智能领域,公开了一种基于数字人技术的人机实时对话方法及系统,其技术方案要点是采集客户语音并根据采集的客户语音生成应答语音;根据应答语音得到运动数据;根据运动数据生成数字人形象动画;显示数字人形象动画并同步播放应答语音,能够不用提前录制和制作客服人物的视频和动画,就能够实时显示数字人形象,并且能够根据客户的语音实时的展示数字人形象动画和应答语音。
-
公开(公告)号:CN114820917A
公开(公告)日:2022-07-29
申请号:CN202110125588.3
申请日:2021-01-29
申请人: 宿迁硅基智能科技有限公司
摘要: 本发明公开了基于fbx文件的面部骨骼绑定自动迁移方法及系统,涉及基于人工智能的动画制作技术领域,旨在解决现有技术对于新模型面部骨骼绑定成本高、效率低的问题。其技术方案要点是将已有蒙皮绑定的第一模型拟合至待蒙皮绑定的第二模型,获得第三模型,根据第二模型与第三模型的映射关系、第三模型的骨骼数据和第三模型的蒙皮信息,确定第二模型的骨骼数据和蒙皮信息,最后生成第二模型的fbx文件,完成第二模型的蒙皮绑定。本发明达到了将已有的面部骨骼绑定自动迁移到其他模型上,提高了新模型绑定的效率并降低了人力成本。
-
公开(公告)号:CN113592985A
公开(公告)日:2021-11-02
申请号:CN202110901418.X
申请日:2021-08-06
申请人: 宿迁硅基智能科技有限公司
摘要: 本申请实施例提供了一种混合变形值的输出方法及装置、存储介质、电子装置,所述方法包括:对获取的目标音频数据进行特征提取,得到目标音频特征向量;将目标音频特征向量和目标标识输入音频驱动动画模型;将目标音频特征向量输入包含多层卷积层的音频编码层,根据上一层t时刻和t‑n时刻之间的输入特征向量确定下一层(2t‑n)/2时刻的输入特征向量,将与上一层的输入特征向量有因果关系的特征向量确定为有效特征向量,依次根据每一层的有效特征向量输出目标音频编码特征,并将目标标识输入独热编码层进行二进制向量编码,得到目标标识编码特征;根据目标音频编码特征和目标标识编码特征,通过音频驱动动画模型输出目标音频数据对应的混合变形值。
-
公开(公告)号:CN115272537A
公开(公告)日:2022-11-01
申请号:CN202210723651.8
申请日:2021-08-06
申请人: 宿迁硅基智能科技有限公司
摘要: 本申请实施例提供了一种基于因果卷积的音频驱动表情方法及装置,所述方法包括:对获取的目标音频数据进行特征提取,得到目标音频特征向量;将目标音频特征向量和目标标识输入音频驱动动画模型;将目标音频特征向量输入包含多层卷积层的音频编码层,根据上一层t时刻和t‑n时刻之间的输入特征向量确定下一层(2t‑n)/2时刻的输入特征向量,将与上一层的输入特征向量有因果关系的特征向量确定为有效特征向量,依次根据每一层的有效特征向量输出目标音频编码特征,并将目标标识输入独热编码层进行二进制向量编码,得到目标标识编码特征;根据目标音频编码特征和目标标识编码特征,通过音频驱动动画模型输出目标音频数据对应的混合变形值。
-
公开(公告)号:CN114663574A
公开(公告)日:2022-06-24
申请号:CN202011536305.6
申请日:2020-12-23
申请人: 宿迁硅基智能科技有限公司
摘要: 本发明涉及三维建模领域,公开了一种基于单视角照片的三维人脸自动建模方法、系统及装置,其技术方案要点是检测得到人像正脸照片中的人脸关键点;根据人像正脸照片选择底层模板模型,并在底层模板模型的模型顶点中选择出对应人脸关键点的关键点顶点,将关键点顶点在人像正脸照片所在平面进行二维投影;根据人脸关键点和关键点顶点二维投影位置的距离,拟合生成初步三维模型;将初步三维模型的模型顶点在二维平面投影,得到模型顶点的纹理坐标;对人像正脸照片进行预处理,并按照模型顶点的纹理坐标,将预处理后的人像正脸照片贴图至初步三维模型,得到目标三维模型,能够得到真实自然完整的目标三维模型。
-
-
-
-
-
-