-
公开(公告)号:CN108363706A
公开(公告)日:2018-08-03
申请号:CN201710056801.3
申请日:2017-01-25
申请人: 北京搜狗科技发展有限公司
CPC分类号: G06F16/3329 , G10L13/033 , G10L13/0335 , G10L15/063 , G10L15/07 , G10L15/22 , G10L25/63 , G10L2015/227 , G10L2015/228
摘要: 本发明实施例提供了一种人机对话交互的方法和装置,其中所述方法包括:获取交互方的语音数据、图像数据、以及场景数据;依据所述场景数据获取对应的场景特征模型;将所述语音数据和图像数据输入至所述场景特征模型得到目标人物特征属性;采用所述目标人物特征属性和场景数据确定目标对话策略;基于所述目标对话策略控制机器人的表情、语音和/或动作输出。本发明实施例使得在人机交互的过程中,机器可以根据目标对话策略配合交互方当前对话的特征,与交互方进行拟人化的对话,从而提高交互方交互体验。
-
公开(公告)号:CN105529024A
公开(公告)日:2016-04-27
申请号:CN201510667009.2
申请日:2015-10-15
申请人: 雅马哈株式会社
发明人: 入山达也
CPC分类号: G10L13/10 , G10H1/0066 , G10H1/46 , G10H2250/455 , G10L13/0335 , G10L13/08 , G10L13/04
摘要: 一种音韵信息合成装置,其特征在于,具有:操作强度信息获取部,其获取表示操作强度的信息;以及音韵信息生成部,其基于从所述操作强度信息获取部供给的表示操作强度的信息,将对合成对象即歌唱语音的音韵进行指定的音韵信息输出。
-
公开(公告)号:CN104347080A
公开(公告)日:2015-02-11
申请号:CN201410392430.2
申请日:2014-08-11
申请人: 雅马哈株式会社
发明人: 橘诚
IPC分类号: G10L25/03 , G10L13/033
CPC分类号: G10H1/361 , G10H7/00 , G10H7/008 , G10H7/02 , G10H2210/00 , G10H2210/051 , G10H2210/066 , G10H2210/091 , G10H2210/095 , G10H2210/325 , G10H2210/331 , G10H2220/155 , G10H2240/121 , G10H2250/455 , G10L13/00 , G10L13/0335 , G10L13/06 , G10L13/10
摘要: 本发明公开了语音分析装置和语音分析方法,该语音分析方法包括产生相对音高的时间序列的变量提取步骤。所述相对音高是从乐曲数据产生的在时间轴上连续波动的音高和参考语音的音高之差。所述乐曲数据按时间序列指定乐曲的各个音符。所述参考语音是通过歌唱所述乐曲而得到的语音。通过对其中未检测到音高的无语音区间进行插值处理来处理所述参考语音的音高。所述语音分析方法还包括特性分析步骤,其产生定义了用于表示在所述变量提取步骤中产生的相对音高的时间序列的模型的歌唱特性数据。
-
公开(公告)号:CN108369805A
公开(公告)日:2018-08-03
申请号:CN201780003279.0
申请日:2017-12-27
申请人: 深圳前海达闼云端智能科技有限公司
发明人: 张含波
IPC分类号: G10L15/22 , G10L13/033 , G10L21/034
CPC分类号: G10L13/0335 , G10L15/22 , G10L21/034 , G10L2015/225
摘要: 本发明实施例提供了一种语音交互方法、装置和智能终端。其中,所述方法包括:当接收到语音交互指令时,检测当前交互环境的噪声信息,所述噪声信息包括噪声音量和噪声频率;根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率;基于所述主频率合成所述应答语音;根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量;以所确定的所述音量播放所述应答语音。通过上述技术方案,本发明实施例能够基于声音的掩蔽效应,根据当前的交互环境的噪声信息动态调整其应答语音的主频率和播放音量,使得用户在任意交互环境下都可以获得较好的语音交互体验。
-
公开(公告)号:CN107039033A
公开(公告)日:2017-08-11
申请号:CN201710248786.2
申请日:2017-04-17
申请人: 海南职业技术学院
IPC分类号: G10L13/08 , G10L13/10 , G10L13/033 , G10L13/04
CPC分类号: G10L13/08 , G10L13/033 , G10L13/0335 , G10L13/04 , G10L13/10
摘要: 本发明涉及一种语音合成装置,包括语音构建模块、接收模块、音调处理模块、模型修正模块和合成模块,其中音调处理模块用于在所接收的待合成语音文本中,根据指示情感状态的状态信息,产生用于影响合成语音的音调信息;最后经过合成模块合成带有音调的合成语音数据,从而使得合成后的语音自然度较高,进而提高了用户体验。
-
公开(公告)号:CN101271688A
公开(公告)日:2008-09-24
申请号:CN200810086741.0
申请日:2008-03-20
申请人: 富士通株式会社
IPC分类号: G10L13/08
CPC分类号: G10L13/0335 , G10L13/033 , G10L21/003
摘要: 本发明涉及韵律修改装置和方法及存储有韵律修改程序的记录介质。该韵律修改装置包括:真实话音韵律输入部,用于接收从人类发声中提取的真实话音韵律信息;规则韵律生成部,用于针对真实话音韵律信息中的至少包括要修改的音素或音素串的部分,利用表示人类发声中的规则的或统计出的音素长度的数据来生成规则韵律信息(其具有确定音素之间的边界的规则音素边界和音素的规则音素长度);以及真实话音韵律修改部,其利用生成的规则韵律信息,重置真实话音音素边界,以使真实话音韵律信息中的要修改的音素或音素串的真实话音音素边界和真实话音音素长度接近于人类发声的实际音素边界和实际音素长度,由此修改真实话音韵律信息。
-
公开(公告)号:CN108369805B
公开(公告)日:2019-08-13
申请号:CN201780003279.0
申请日:2017-12-27
申请人: 深圳前海达闼云端智能科技有限公司
发明人: 张含波
IPC分类号: G10L15/22 , G10L13/033 , G10L21/034
CPC分类号: G10L13/0335 , G10L15/22 , G10L21/034 , G10L2015/225
摘要: 本发明实施例提供了一种语音交互方法、装置和智能终端。其中,所述方法包括:当接收到语音交互指令时,检测当前交互环境的噪声信息,所述噪声信息包括噪声音量和噪声频率;根据所述噪声频率确定用于合成与所述语音交互指令对应的应答语音的主频率;基于所述主频率合成所述应答语音;根据所述噪声音量、所述噪声频率和所述应答语音的主频率确定播放所述应答语音的音量;以所确定的所述音量播放所述应答语音。通过上述技术方案,本发明实施例能够基于声音的掩蔽效应,根据当前的交互环境的噪声信息动态调整其应答语音的主频率和播放音量,使得用户在任意交互环境下都可以获得较好的语音交互体验。
-
公开(公告)号:CN107077840A
公开(公告)日:2017-08-18
申请号:CN201580056851.0
申请日:2015-10-20
申请人: 雅马哈株式会社
CPC分类号: G10L13/0335 , G10L15/22 , G10L21/0364 , G10L25/90
摘要: 本发明是用于针对由说话者(用户)说出的语音自动地生成口语回应的技术的改进,并且其特征在于:根据说话者的语音的音高控制口语回应的音高。接收说话者说出的话语(例如,问题)的语音信号(102),并且检测话语的代表性部分的音高(例如,最高音高)(106)。适当地获取对话语的回应的语音数据(110、124),并且获取基于所获取的口语回应语音数据的音高(例如,平均音高)。确定用于将获取的音高偏移至与代表性部分的音高具有特定关系的目标音高的音高偏移量(114)。当基于回应语音数据来合成口语回应时,根据音高偏移量将合成的口语回应的音高进行偏移。
-
公开(公告)号:CN105247609A
公开(公告)日:2016-01-13
申请号:CN201480031099.X
申请日:2014-06-02
申请人: 雅马哈株式会社
IPC分类号: G10L13/00 , G10L13/033 , G10L13/10 , G10L15/22
CPC分类号: G10L13/0335 , G10L13/027 , G10L13/033 , G10L13/06 , G10L13/10 , G10L15/18 , G10L25/90 , H04M2201/39
摘要: 本发明设置有:语音输入单元(102),其经由语音信号接收话语(询问);响应产生单元(110),其创建针对所述话语的响应(回答)的语音序列;音高分析单元(106),其对所述话语的第一区间(例如,句尾)的音高进行分析;以及语音产生单元(语音合成单元(112)等),其经由语音产生由所述语音序列表示的响应。所述语音产生单元以如下方式控制整个响应的音高:使所述响应的第二区间(例如,句尾)的音高相对于所述话语的第一区间的音高实现规定的音高(例如,向下五度)。由此实现对能够给用户自然感觉的响应语音的合成。
-
公开(公告)号:CN108140370A
公开(公告)日:2018-06-08
申请号:CN201680057513.3
申请日:2016-10-06
申请人: 索尼公司
CPC分类号: G06F3/017 , G06F3/167 , G10H1/00 , G10H1/0091 , G10H1/043 , G10H1/053 , G10H2210/195 , G10H2210/281 , G10H2220/201 , G10H2220/211 , G10H2220/321 , G10H2220/351 , G10H2220/371 , G10H2220/395 , G10L13/0335 , G10L21/16 , H04R1/04 , H04R1/222
摘要: 【目标】提供可进行呈现以使得可在听觉上感觉身体运动自身的信号处理设备。【解决方案】提供一种信号处理设备,包含:控制单元,被配置成基于根据附接到用具或身体的传感器的附接部分的运动而产生的波形信号来对所述波形信号或另一波形信号执行效果处理,所述波形信号是从所述传感器输出。信号处理设备可以进行呈现以使得可在听觉上感觉身体运动自身。
-
-
-
-
-
-
-
-
-