一种语音交互方法、装置和智能终端

    公开(公告)号:CN108369805A

    公开(公告)日:2018-08-03

    申请号:CN201780003279.0

    申请日:2017-12-27

    发明人: 张含波

    摘要: 本发明实施例提供了一种语音交互方法、装置和智能终端。其中,所述方法包括:当接收到语音交互指令时,检测当前交互环境的噪声信息,所述噪声信息包括噪声音量和噪声频率;根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率;基于所述主频率合成所述应答语音;根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量;以所确定的所述音量播放所述应答语音。通过上述技术方案,本发明实施例能够基于声音的掩蔽效应,根据当前的交互环境的噪声信息动态调整其应答语音的主频率和播放音量,使得用户在任意交互环境下都可以获得较好的语音交互体验。

    韵律修改装置和方法及存储有韵律修改程序的记录介质

    公开(公告)号:CN101271688A

    公开(公告)日:2008-09-24

    申请号:CN200810086741.0

    申请日:2008-03-20

    IPC分类号: G10L13/08

    摘要: 本发明涉及韵律修改装置和方法及存储有韵律修改程序的记录介质。该韵律修改装置包括:真实话音韵律输入部,用于接收从人类发声中提取的真实话音韵律信息;规则韵律生成部,用于针对真实话音韵律信息中的至少包括要修改的音素或音素串的部分,利用表示人类发声中的规则的或统计出的音素长度的数据来生成规则韵律信息(其具有确定音素之间的边界的规则音素边界和音素的规则音素长度);以及真实话音韵律修改部,其利用生成的规则韵律信息,重置真实话音音素边界,以使真实话音韵律信息中的要修改的音素或音素串的真实话音音素边界和真实话音音素长度接近于人类发声的实际音素边界和实际音素长度,由此修改真实话音韵律信息。

    一种语音交互方法、装置和智能终端

    公开(公告)号:CN108369805B

    公开(公告)日:2019-08-13

    申请号:CN201780003279.0

    申请日:2017-12-27

    发明人: 张含波

    摘要: 本发明实施例提供了一种语音交互方法、装置和智能终端。其中,所述方法包括:当接收到语音交互指令时,检测当前交互环境的噪声信息,所述噪声信息包括噪声音量和噪声频率;根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率;基于所述主频率合成所述应答语音;根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量;以所确定的所述音量播放所述应答语音。通过上述技术方案,本发明实施例能够基于声音的掩蔽效应,根据当前的交互环境的噪声信息动态调整其应答语音的主频率和播放音量,使得用户在任意交互环境下都可以获得较好的语音交互体验。

    语音合成装置和方法
    8.
    发明公开

    公开(公告)号:CN107077840A

    公开(公告)日:2017-08-18

    申请号:CN201580056851.0

    申请日:2015-10-20

    IPC分类号: G10L13/10 G10L25/90

    摘要: 本发明是用于针对由说话者(用户)说出的语音自动地生成口语回应的技术的改进,并且其特征在于:根据说话者的语音的音高控制口语回应的音高。接收说话者说出的话语(例如,问题)的语音信号(102),并且检测话语的代表性部分的音高(例如,最高音高)(106)。适当地获取对话语的回应的语音数据(110、124),并且获取基于所获取的口语回应语音数据的音高(例如,平均音高)。确定用于将获取的音高偏移至与代表性部分的音高具有特定关系的目标音高的音高偏移量(114)。当基于回应语音数据来合成口语回应时,根据音高偏移量将合成的口语回应的音高进行偏移。