-
公开(公告)号:CN105206257A
公开(公告)日:2015-12-30
申请号:CN201510673278.X
申请日:2015-10-14
申请人: 科大讯飞股份有限公司
摘要: 本发明公开了一种声音转换方法及装置,该方法包括:接收待转换语音数据;对所述待转换语音数据进行语音识别,得到识别结果及所述识别结果的时长信息;获取目标发音人的语音合成模型;利用所述语音合成模型及所述时长信息生成语音合成参数;利用所述语音合成参数对所述识别结果进行语音合成,得到目标发音人音色合成语音数据。利用本发明,可以使转换后的语音数据的时长与待转换语音数据的时长一致,提高合成语音的自然度。
-
公开(公告)号:CN109300468B
公开(公告)日:2022-09-06
申请号:CN201811063799.3
申请日:2018-09-12
申请人: 科大讯飞股份有限公司
IPC分类号: G10L13/10
摘要: 本申请公开了一种语音标注方法及装置,该方法包括:在获取到用户朗读初始录音文本时录制得到的语音后,可以将其作为待标注的录制语音,然后,根据该录制语音的识别文本对初始录音文本进行修正,以得到目标录音文本,接着,可以根据目标录音文本对录制语音进行韵律标注。可见,本申请实施例不再完全根据初始录音文本对录制语音进行语音标注,而是利用与用户的录制语音在内容上更一致的修正后录音文本对其进行语音标注,可以提高语音标注结果的准确率。
-
公开(公告)号:CN105206257B
公开(公告)日:2019-01-18
申请号:CN201510673278.X
申请日:2015-10-14
申请人: 科大讯飞股份有限公司
摘要: 本发明公开了一种声音转换方法及装置,该方法包括:接收待转换语音数据;对所述待转换语音数据进行语音识别,得到识别结果及所述识别结果的时长信息;获取目标发音人的语音合成模型;利用所述语音合成模型及所述时长信息生成语音合成参数;利用所述语音合成参数对所述识别结果进行语音合成,得到目标发音人音色合成语音数据。利用本发明,可以使转换后的语音数据的时长与待转换语音数据的时长一致,提高合成语音的自然度。
-
公开(公告)号:CN108962284B
公开(公告)日:2021-06-08
申请号:CN201810725856.3
申请日:2018-07-04
申请人: 科大讯飞股份有限公司
摘要: 本申请公开了一种语音录制方法及装置,该方法包括:在用户朗读目标文本的过程中,对朗读语音进行录音,得到初始录音,然后,对初始录音的录音环境和/或录音质量进行检测,接着,判断录音环境和/或录音质量的检测结果是否合格,若检测结果合格,则将初始录音作为目标录音,并保留该目标录音;若检测结果不合格,则将初始录音丢弃。可见,本申请在对用户朗读的目标文本进行录音后,通过对录音环境和/或录音质量进行检测,获得检测结果,并将检测合格的录音作为目标录音保留,将检测不合格的录音丢弃,进而可以利用保留的目标录音构成语音音库,从而提高了语音音库中录音数据的质量。
-
公开(公告)号:CN109300468A
公开(公告)日:2019-02-01
申请号:CN201811063799.3
申请日:2018-09-12
申请人: 科大讯飞股份有限公司
IPC分类号: G10L13/10
摘要: 本申请公开了一种语音标注方法及装置,该方法包括:在获取到用户朗读初始录音文本时录制得到的语音后,可以将其作为待标注的录制语音,然后,根据该录制语音的识别文本对初始录音文本进行修正,以得到目标录音文本,接着,可以根据目标录音文本对录制语音进行韵律标注。可见,本申请实施例不再完全根据初始录音文本对录制语音进行语音标注,而是利用与用户的录制语音在内容上更一致的修正后录音文本对其进行语音标注,可以提高语音标注结果的准确率。
-
公开(公告)号:CN108962284A
公开(公告)日:2018-12-07
申请号:CN201810725856.3
申请日:2018-07-04
申请人: 科大讯飞股份有限公司
CPC分类号: G10L25/78 , G10L13/08 , G10L15/265 , G10L21/007 , G10L25/84 , G10L2025/783
摘要: 本申请公开了一种语音录制方法及装置,该方法包括:在用户朗读目标文本的过程中,对朗读语音进行录音,得到初始录音,然后,对初始录音的录音环境和/或录音质量进行检测,接着,判断录音环境和/或录音质量的检测结果是否合格,若检测结果合格,则将初始录音作为目标录音,并保留该目标录音;若检测结果不合格,则将初始录音丢弃。可见,本申请在对用户朗读的目标文本进行录音后,通过对录音环境和/或录音质量进行检测,获得检测结果,并将检测合格的录音作为目标录音保留,将检测不合格的录音丢弃,进而可以利用保留的目标录音构成语音音库,从而提高了语音音库中录音数据的质量。
-
-
-
-
-