语音合成方法、装置、计算机设备和存储介质

    公开(公告)号:CN112652294A

    公开(公告)日:2021-04-13

    申请号:CN202011562944.X

    申请日:2020-12-25

    发明人: 刘夏冰

    IPC分类号: G10L13/08

    摘要: 本申请涉及一种语音合成方法、装置、计算机设备和存储介质,适用于计算机技术领域。方法包括:获取待合成的目标文本,目标文本由至少两种语言组成;将目标文本输入至文本合成模型中,文本合成模型包括与至少两种语言一一对应的至少两个特征提取模块、特征融合模块以及语音转换模块;分别通过至少两个特征提取模块对目标文本进行特征提取处理,得到与至少两个特征提取模块一一对应的至少两个文本特征;通过特征融合模块将至少两个文本特征进行融合处理,得到融合特征;通过语音转换模块,对融合特征进行语音转换处理,得到目标文本对应的合成语音。采用本方法能够将至少由两种语言组成的目标文本合成对应的合成语音。

    语音会话方法、装置、计算机设备和存储介质

    公开(公告)号:CN112071300A

    公开(公告)日:2020-12-11

    申请号:CN202011258803.9

    申请日:2020-11-12

    IPC分类号: G10L13/02 G10L13/08

    摘要: 本申请涉及一种语音会话方法、装置、计算机设备和存储介质。该方法包括:获取待生成语音的目标会话文本;对所述目标会话文本进行语义识别,得到所述目标会话文本中的目标分词对应的语义特征向量,基于所述目标分词对应的语义特征向量确定所述目标分词对应的情感韵律标签;确定所述目标会话文本中的语义边界,基于所述语义边界在所述目标会话文本中插入边界文本,得到第一会话文本;将所述第一会话文本以及所述目标分词对应的情感韵律标签输入到语音合成模型中,合成目标会话语音,其中,所述语音合成模型对所述边界文本进行编码,基于编码得到的向量得到所述目标会话语音中的语音停顿信息;输出所述目标会话语音。采用本方法能够提高会话效果。

    语音合成方法、装置、计算机设备和存储介质

    公开(公告)号:CN112652294B

    公开(公告)日:2023-10-24

    申请号:CN202011562944.X

    申请日:2020-12-25

    发明人: 刘夏冰

    IPC分类号: G10L13/08

    摘要: 本申请涉及一种语音合成方法、装置、计算机设备和存储介质,适用于计算机技术领域。方法包括:获取待合成的目标文本,目标文本由至少两种语言组成;将目标文本输入至文本合成模型中,文本合成模型包括与至少两种语言一一对应的至少两个特征提取模块、特征融合模块以及语音转换模块;分别通过至少两个特征提取模块对目标文本进行特征提取处理,得到与至少两个特征提取模块一一对应的至少两个文本特征;通过特征融合模块将至少两个文本特征进行融合处理,得到融合特征;通过语音转换模块,对融合特征进行语音转换处理,得到目标文本对应的合成语音。采用本方法能够将至少由两种语言组成的目标文本合成对应的合成语音。

    语音会话方法、装置、计算机设备和存储介质

    公开(公告)号:CN112071300B

    公开(公告)日:2021-04-06

    申请号:CN202011258803.9

    申请日:2020-11-12

    IPC分类号: G10L13/02 G10L13/08

    摘要: 本申请涉及一种语音会话方法、装置、计算机设备和存储介质。该方法包括:获取待生成语音的目标会话文本;对所述目标会话文本进行语义识别,得到所述目标会话文本中的目标分词对应的语义特征向量,基于所述目标分词对应的语义特征向量确定所述目标分词对应的情感韵律标签;确定所述目标会话文本中的语义边界,基于所述语义边界在所述目标会话文本中插入边界文本,得到第一会话文本;将所述第一会话文本以及所述目标分词对应的情感韵律标签输入到语音合成模型中,合成目标会话语音,其中,所述语音合成模型对所述边界文本进行编码,基于编码得到的向量得到所述目标会话语音中的语音停顿信息;输出所述目标会话语音。采用本方法能够提高会话效果。