-
公开(公告)号:CN114822490A
公开(公告)日:2022-07-29
申请号:CN202210346114.6
申请日:2022-03-31
申请人: 美的集团(上海)有限公司 , 美的集团股份有限公司
摘要: 本申请涉及语音合成领域,提供一种语音拼接方法和语音拼接装置,语音拼接方法,包括:对目标文本的韵律音素序列进行切分,生成多个分句序列,韵律音素序列包括与目标文本对应的多个音素以及位于相邻音素之间的韵律标识符;分别对分句序列进行语音合成,生成多个第一分句语音信息,第一分句语音信息包括每一个韵律标识符和音素对应的第一时长;基于第一时长和第一分句语音信息对应的分句序列在韵律音素序列中的切分顺序,拼接多个第一分句语音信息,生成目标语音。本申请的语音拼接方法,能够实现在不需要预设语音拼接单元库且不需要对待拼接语音单元进行平滑处理的基础上,即可提高相邻第一分句语音信息拼接处的自然度与流畅度。
-
公开(公告)号:CN114708848A
公开(公告)日:2022-07-05
申请号:CN202210346097.6
申请日:2022-03-31
申请人: 美的集团(上海)有限公司 , 美的集团股份有限公司
摘要: 本申请涉及语音合成领域,提供一种音视频文件大小的获取方法和装置,所述音视频文件大小的获取方法,包括:获取目标文本;提取目标文本的特征,生成目标韵律特征和目标音素特征;基于生成目标韵律特征和目标音素特征,生成目标音频文件的目标文件大小,目标音频文件为对目标文本进行语音合成所生成的。本申请的音视频文件大小的获取方法,通过对目标文本进行韵律特征和音素特征提取,并基于提取得到的目标韵律特征和目标音素特征预测由该目标文本所合成的目标音频文件的大小信息,能够在目标音频文件生成之前即可实现该目标文件的大小值的预测,具有一定的及时性;且预测结果的准确性和精确性较高。
-