-
公开(公告)号:CN107342085A
公开(公告)日:2017-11-10
申请号:CN201710606704.7
申请日:2017-07-24
申请人: 深圳云知声信息技术有限公司
IPC分类号: G10L15/22
CPC分类号: G10L15/22 , G10L15/222
摘要: 本发明是关于一种语音处理方法及装置,其中,语音处理方法包括:接收第一语音数据信息,并进行语音识别得到第一语音识别结果;当终端设备在执行第一语音识别结果的过程中,若接收到第二语音数据信息,进行语音识别得到第二语音识别结果;分别确定第一语音识别结果和第二语音信息识别结果所包含的信息类型;根据第一语音识别结果所包含的第一信息类型和第二语音信息识别结果所包含的第二信息类型以及预设的行为打断规则,确定第一语音识别结果和第二语音识别结果的执行方式。通过该技术方案,可以在用户在与终端对话时,避免用户等待过长的时间,即用户不需要等待终端播报完之后再开始说话,减少用户的等待时间,提升用户的使用体验。
-
公开(公告)号:CN106030701A
公开(公告)日:2016-10-12
申请号:CN201580009626.1
申请日:2015-01-31
申请人: 奥迪股份公司
IPC分类号: G10L15/22
CPC分类号: G10L15/222 , B60R16/0373 , G10L13/00 , G10L15/18 , G10L15/22 , G10L2015/221 , G10L2015/223 , G10L2015/225 , G10L2015/228
摘要: 本发明涉及一种用于通过语音对话装置检测至少两个具有待关联信息内容的待检测信息的方法,其中,在所述信息的检测之间分别通过所述语音对话装置进行语音输出,其中,分别通过检测自然语言的语音输入数据和从所述语音输入数据通过语音识别算法提取对应的信息来检测所述信息,其中,在满足重复条件时通过所述语音对话装置生成自然语言的摘要输出并且作为语音输出来输出,所述语音输出包括至少一个已经检测到的信息或所述信息的一部分的自然语言的再现或由所述信息导出的信息。
-
公开(公告)号:CN108701458A
公开(公告)日:2018-10-23
申请号:CN201780014607.7
申请日:2017-02-24
申请人: 微软技术许可有限责任公司
发明人: R·J·弗勒利克
IPC分类号: G10L15/22 , G10L15/08 , G10L15/19 , G10L15/183
CPC分类号: G10L15/22 , G10L15/02 , G10L15/063 , G10L15/183 , G10L15/19 , G10L15/222 , G10L25/87 , G10L2015/0635 , G10L2015/088 , G10L2015/223 , H04N7/157
摘要: 从用户接收语音输入。ASR系统在存储器中生成其已经在该语音输入中识别出的单词的集合,并且在其每次在该语音输入中识别出新的单词时更新该集合以将该新的单词添加至该集合。信息在话音活动仍在进行时被预先取回以用于响应于要在所述话音活动间隔的结束时被输出而进行传递。
-
公开(公告)号:CN105144285A
公开(公告)日:2015-12-09
申请号:CN201480021678.6
申请日:2014-06-10
申请人: 松下电器(美国)知识产权公司
IPC分类号: G10L15/22
CPC分类号: G10L15/22 , G06F3/167 , G10L15/08 , G10L15/222 , G10L15/32 , G10L2015/088
摘要: 一种声音对话方法,由具备声音信号生成部、声音对话代理部、声音输出部和声音输入控制部的声音对话系统进行,声音信号生成部受理声音输入,生成基于所受理的声音输入的声音信号;声音对话代理部对由声音信号生成部生成的声音信号进行声音识别处理,进行基于该声音识别处理的结果的处理,生成有关该处理的应答信号;声音输出部输出基于由声音对话代理部生成的应答信号的声音;在由声音输出部输出声音的情况下,声音输入控制部从该输出起规定期间中,使声音信号生成部成为能够进行声音输入的受理的可受理状态。
-
公开(公告)号:CN108806690A
公开(公告)日:2018-11-13
申请号:CN201810908919.9
申请日:2014-06-10
申请人: 松下电器(美国)知识产权公司
CPC分类号: G10L15/22 , G06F3/167 , G10L15/08 , G10L15/222 , G10L15/32 , G10L2015/088
摘要: 提供声音对话方法及声音对话代理服务器。声音对话方法由声音对话代理服务器进行,声音对话代理服务器具备存储器,该存储器存储将其他声音对话代理服务器与一个以上的关键字建立对应的代理信息;在声音对话方法中,受理输入声音信号;对输入声音信号进行声音识别处理;基于声音识别处理的结果和存储在存储器中的代理信息,决定通过声音对话代理服务器和其他声音对话代理服务器中的哪一个进行基于该输入声音信号的处理;在决定为通过声音对话代理服务器进行的情况下,进行基于声音识别处理的结果的处理,输出与该处理有关的应答声音信号;在决定为通过其他声音对话代理服务器进行的情况下,将输入声音信号向其他声音对话代理部传送。
-
公开(公告)号:CN108351872A
公开(公告)日:2018-07-31
申请号:CN201680054589.0
申请日:2016-09-20
申请人: 亚马逊技术股份有限公司
CPC分类号: G06F3/167 , G10L15/00 , G10L15/063 , G10L15/1815 , G10L15/22 , G10L15/222 , G10L15/26 , G10L15/32 , G10L2015/088 , G10L2015/223 , G10L2015/226
摘要: 一种系统,可使用多个语音接口设备来通过语音与用户交互。所述语音接口设备中的全部或部分可检测用户话语并且可启动语音处理以确定所述话语的意思或意图。在所述语音处理内,可采用仲裁来选择所述多个语音接口设备中的一个来对所述用户话语作出响应。仲裁可部分地基于直接地或间接地指示所述用户与所述设备的接近度的元数据,并且可选择被认为最靠近所述用户的所述设备来对所述用户话语作出响应。
-
公开(公告)号:CN108228131A
公开(公告)日:2018-06-29
申请号:CN201710843341.9
申请日:2017-09-18
申请人: 声音猎手公司
CPC分类号: G10L15/30 , G06F17/279 , G10L15/22 , G10L15/222 , G10L2015/223
摘要: 本公开涉及自然语言虚拟助理中的全双工话语处理。查询处理系统处理表示用户所说的一连串查询的输入音频流。查询处理系统持续监听输入音频流、解析查询并在中间流中采取适当的动作。在一些实施例中,系统并行地处理查询,这受串行约束限制。在一些实施例中,系统在先查询的执行仍在进行中时解析并执行查询。为了适应倾向于慢慢讲话并在单独的部分中表达想法的用户,查询处理系统在其检测到新的语音话语改变了在先查询的含义时,停止输出与在先查询相对应的结果。
-
公开(公告)号:CN105138110A
公开(公告)日:2015-12-09
申请号:CN201410236274.0
申请日:2014-05-29
申请人: 中兴通讯股份有限公司
CPC分类号: G10L15/222 , G06F3/167 , G10L21/0208 , G10L25/84 , G10L2015/223 , G10L2021/02087
摘要: 本发明公开了一种语音交互方法及装置,在上述方法中,获取第一语音控制指令,执行与第一语音控制指令对应的第一操作;采集混合音频数据,其中,混合音频数据包括:在执行第一操作时播放的音频数据和第二语音控制指令;从混合音频数据中滤除播放的音频数据,识别第二语音控制指令;按照第二语音控制指令从第一操作切换至与第二语音控制指令对应的第二操作。根据本发明提供的技术方案,加强了语音交互的识别处理能力,提高了语音控制交互的效率及用户体验。
-
公开(公告)号:CN104956436B
公开(公告)日:2018-05-29
申请号:CN201380067993.8
申请日:2013-08-09
申请人: 株式会社索思未来
CPC分类号: G10L15/08 , G10L13/00 , G10L15/22 , G10L15/222 , G10L15/28 , G10L17/22 , G10L21/0208 , G10L2015/088 , G10L2015/223 , G10L2021/02082
摘要: 用于识别用户的语音的带有语音识别功能的设备(1),具备:扬声器(101),向空间发出语音;麦克风(102),收集该空间的语音;第一语音识别部(103),识别由所述麦克风(102)收集的语音;命令控制部(105),根据由所述第一语音识别部(103)识别的语音,发行用于控制所述带有语音识别功能的设备(1)的命令;以及控制部,利用从所述扬声器(101)将要发出的语音,禁止由所述命令控制部(105)发行所述命令。
-
公开(公告)号:CN107112018A
公开(公告)日:2017-08-29
申请号:CN201580068958.7
申请日:2015-09-15
申请人: 索尼公司
CPC分类号: G10L15/22 , G10L15/02 , G10L15/04 , G10L15/222 , G10L15/28 , G10L2015/025 , G10L2015/221 , G10L2015/225
摘要: 提供能够提高针对采集声音数据的语音识别准确度的技术。一种信息处理装置设置有:采集声音数据获取单元,用于获取采集声音数据;以及输出控制单元,用于使输出单元能够至少输出采集声音数据的状态是否适合于语音识别。
-
-
-
-
-
-
-
-
-