Patent search ap:("科大讯飞股份有限公司") AND inv:"左童春" Page 1

1.

发明授权
虚拟形象合成方法、装置、电子设备和存储介质有权

公开(公告)号：CN111145282B

公开(公告)日：2023-12-05

申请号：CN201911274701.3

申请日：2019-12-12

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 何山 , 胡金水 , 刘聪

IPC: G06T11/00 , G06F16/783 , G06N3/094

Abstract: 本发明实施例提供一种虚拟形象合成方法、装置、电子设备和存储介质，其中方法包括：确定语音数据的相关特征；相关特征用于表征语音数据中包含的与发言人表情相关的特征；将形象数据以及相关特征输入至表情合成模型中，得到表情合成模型输出的虚拟形象视频，虚拟形象视频中的虚拟形象配置有对应于语音数据的表情；其中，表情合成模型是基于样本发言人视频，样本发言人视频对应的样本语音数据的相关特征以及样本形象数据训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质，能够使得虚拟形象表情更好地贴合语音数据，更加自然真实。

2.

发明授权
虚拟形象生成方法及相关装置、电子设备、存储介质有权

公开(公告)号：CN114913303B

公开(公告)日：2024-11-08

申请号：CN202210395741.9

申请日：2022-04-14

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06T17/20 , G06V10/80

Abstract: 本申请公开了一种虚拟形象生成方法及相关装置、电子设备、存储介质，其中，虚拟形象生成方法包括：获取用户对期望虚拟形象的描述文本，并获取若干形象特征；基于各形象特征分别与描述文本的文本特征进行形象生成，得到候选虚拟形象；响应于用户选择候选虚拟形象作为目标虚拟形象，获取符合目标虚拟形象的特征分布的特征表示作为新的形象特征；基于新的形象特征和文本特征生成最终虚拟形象。上述方案，能够在满足个性化的虚拟形象生成需求基础上，减少虚拟形象生成的时长和成本，并降低对硬件设备的要求。

3.

发明公开
视频合成方法、装置、设备及存储介质审中-实审

公开(公告)号：CN117750125A

公开(公告)日：2024-03-22

申请号：CN202311872648.3

申请日：2023-12-29

Applicant: 科大讯飞股份有限公司 , 科大讯飞(苏州)科技有限公司

Inventor： 何山 , 左童春 , 周良 , 殷兵 , 潘青华 , 刘聪

IPC: H04N21/44 , H04N21/472

Abstract: 本申请公开了一种视频合成方法、装置、设备及存储介质支持多模态条件信息控制下的视频合成，方法包括：获取指定的初始图像，及与待合成视频匹配的多模态条件信息，所述多模态条件信息包括与所述待合成视频匹配的音频信息和/或文本描述信息；提取所述初始图像对应的初始骨架图；以所述多模态条件信息作为控制条件，利用配置的扩散模型在所述控制条件的指导下，生成与所述多模态条件信息语义匹配的连续骨架图，由所述初始骨架图及生成的所述连续骨架图依序组成目标骨架图序列；基于所述目标骨架图序列对所述初始图像的图像特征进行变形，以生成视频序列。实现了根据用户的合成要求，对初始图像进行视频合成的目的，满足用户个性化的合成需求。

4.

发明公开
视频生成方法、装置、设备和存储介质审中-实审

公开(公告)号：CN117336567A

公开(公告)日：2024-01-02

申请号：CN202311030837.6

申请日：2023-08-14

Applicant: 科大讯飞股份有限公司

Inventor： 高建清 , 左童春 , 姚仕豪 , 何山 , 郜静文 , 杨硕 , 殷保才 , 殷兵 , 刘烨秋 , 付新勇 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 胡国平 , 刘聪 , 魏思 , 王士进 , 刘权

IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08

Abstract: 本申请公开了一种视频生成方法、装置、设备和存储介质，其中，视频生成方法包括：获取原始文稿和原始文稿的原始配图；获取响应于原始文稿和原始配图而分析得到且用于配音的参考数据；其中，参考数据包含文案文本、表征文案文本所蕴含情感信息的第一文本和至少表征文案文本需采用发音音色的第二文本；基于参考数据进行语音合成，得到视频配音；至少基于原始配图和视频配音，生成目标视频。上述方案，能够提高视频生成效率，降低视频生成成本。

5.

发明公开
虚拟形象合成方法、装置、电子设备和存储介质有权

公开(公告)号：CN111145282A

公开(公告)日：2020-05-12

申请号：CN201911274701.3

申请日：2019-12-12

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 何山 , 胡金水 , 刘聪

IPC: G06T11/00 , G06F16/783 , G06N3/08

Abstract: 本发明实施例提供一种虚拟形象合成方法、装置、电子设备和存储介质，其中方法包括：确定语音数据的相关特征；相关特征用于表征语音数据中包含的与发言人表情相关的特征；将形象数据以及相关特征输入至表情合成模型中，得到表情合成模型输出的虚拟形象视频，虚拟形象视频中的虚拟形象配置有对应于语音数据的表情；其中，表情合成模型是基于样本发言人视频，样本发言人视频对应的样本语音数据的相关特征以及样本形象数据训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质，能够使得虚拟形象表情更好地贴合语音数据，更加自然真实。

6.

发明授权
GAN网络压缩方法、装置、设备及存储介质有权

公开(公告)号：CN112465115B

公开(公告)日：2024-05-31

申请号：CN202011341346.X

申请日：2020-11-25

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06N3/0475 , G06N3/082 , G06N3/094

Abstract: 本申请公开了一种GAN网络压缩方法、装置、设备及存储介质，对于待压缩的GAN网络，将其中每一层的原始操作子替换为至少一个候选操作子，每一层的输出由每一层替换后的各候选操作子的输出组成，并且候选操作子的计算量小于被替换的原始操作子的计算量，初始化GAN网络中各候选操作子的参数及其权重，交替更新生成网络G和判别网络D，直至GAN网络收敛为止，基于收敛的GAN网络中每一层各候选操作子的最终权重，确定每一层最终保留的操作子，以得到压缩后的GAN网络。本申请方案同时对GAN网络中生成网络G和判别网络D进行压缩，在实现对GAN网络压缩的同时，保证了压缩后GAN网络的平衡性。

7.

发明公开
面部图像生成方法、装置、设备及存储介质无效

公开(公告)号：CN115810215A

公开(公告)日：2023-03-17

申请号：CN202310083541.4

申请日：2023-02-08

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 周良 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06V40/16 , G06V10/46 , G06V10/80

Abstract: 本申请提供了一种面部图像生成方法、装置、设备及存储介质，涉及神经网络技术领域。该面部图像生成方法包括：获取面部素材数据，面部素材数据包括面部线框图、面部遮罩图、面部描述文本，以及面部参考图中的至少一种；将面部素材数据输入预先训练的面部生成模型，得到面部生成模型生成的与面部素材数据匹配的目标面部图像。通过一种或多种面部素材数据作为面部生成模型的输入，支持用户可以利用不同模式的面部素材数据对目标面部图像的需求进行表达，降低了用户的操作难度，提高了目标面部图像的生成效率以及准确性。

8.

发明授权
一种虚拟形象生成方法、装置、电子设备及存储介质有权

公开(公告)号：CN115392216B

公开(公告)日：2023-03-14

申请号：CN202211326587.6

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 周良 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06F40/205 , G06F40/289 , G06F16/335

Abstract: 本申请提供一种虚拟形象生成方法、装置、电子设备及存储介质，所述虚拟形象生成方法，在生成虚拟形象的过程中，基于对期望虚拟形象的描述文本的分析，获得了期望虚拟形象的整体形象描述文本和局部形象描述文本，实现了对所述描述文本的细粒度解耦，有利于从整体到局部的更全面把握虚拟形象的特征。之后，基于对整体形象描述文本和局部形象描述文本的联合预测，得到了参考了整体形象特征的、与所述局部形象描述文本对应的预测形象特征，即可以实现对预测虚拟形象的局部形象的控制，同时也考虑了预测虚拟形象的整体形象，提高了虚拟形象的局部形象与整体形象之间的关联，同时也提高了生成的虚拟形象的质量。

9.

发明公开
一种虚拟形象生成方法、装置、电子设备及存储介质有权

公开(公告)号：CN115392216A

公开(公告)日：2022-11-25

申请号：CN202211326587.6

申请日：2022-10-27

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 周良 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06F40/205 , G06F40/289 , G06F16/335

Abstract: 本申请提供一种虚拟形象生成方法、装置、电子设备及存储介质，所述虚拟形象生成方法，在生成虚拟形象的过程中，基于对期望虚拟形象的描述文本的分析，获得了期望虚拟形象的整体形象描述文本和局部形象描述文本，实现了对所述描述文本的细粒度解耦，有利于从整体到局部的更全面把握虚拟形象的特征。之后，基于对整体形象描述文本和局部形象描述文本的联合预测，得到了参考了整体形象特征的、与所述局部形象描述文本对应的预测形象特征，即可以实现对预测虚拟形象的局部形象的控制，同时也考虑了预测虚拟形象的整体形象，提高了虚拟形象的局部形象与整体形象之间的关联，同时也提高了生成的虚拟形象的质量。

10.

发明公开
虚拟形象生成方法及相关装置、电子设备、存储介质有权

公开(公告)号：CN114913303A

公开(公告)日：2022-08-16

申请号：CN202210395741.9

申请日：2022-04-14

Applicant: 科大讯飞股份有限公司

Inventor： 左童春 , 何山 , 胡金水 , 刘聪 , 殷兵

IPC: G06T17/20 , G06K9/62

Abstract: 本申请公开了一种虚拟形象生成方法及相关装置、电子设备、存储介质，其中，虚拟形象生成方法包括：获取用户对期望虚拟形象的描述文本，并获取若干形象特征；基于各形象特征分别与描述文本的文本特征进行形象生成，得到候选虚拟形象；响应于用户选择候选虚拟形象作为目标虚拟形象，获取符合目标虚拟形象的特征分布的特征表示作为新的形象特征；基于新的形象特征和文本特征生成最终虚拟形象。上述方案，能够在满足个性化的虚拟形象生成需求基础上，减少虚拟形象生成的时长和成本，并降低对硬件设备的要求。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification