-
公开(公告)号:CN110520925B
公开(公告)日:2020-12-15
申请号:CN201880021601.7
申请日:2018-06-06
申请人: 谷歌有限责任公司
发明人: G.西姆科 , M.C.帕拉达圣马丁 , S.M.香农
IPC分类号: G10L15/22 , G10L25/78 , G10L15/065 , G10L15/18
摘要: 公开了用于检测询问结束的包括编码在计算机存储介质上的计算机程序的方法、系统和装置。一方面,一种方法包括接收音频的动作。动作还包括应用询问结束模型。动作还包括确定反映话语是完整话语的可能性的置信度分数。动作还包括将置信度分数与阈值进行比较。动作还包括确定话语是否是很可能完整的。动作还包括提供麦克风指令。这种方法可以增加计算设备对用户的效用,特别是对于具有语音失序或障碍的用户。这种方法也可以节省功率,因为麦克风不需要被激活。也可以避免在基于麦克风检测到的额外音频来解释和执行任务中的计算资源的使用。
-
公开(公告)号:CN110520925A
公开(公告)日:2019-11-29
申请号:CN201880021601.7
申请日:2018-06-06
申请人: 谷歌有限责任公司
发明人: G.西姆科 , M.C.帕拉达圣马丁 , S.M.香农
IPC分类号: G10L15/22 , G10L25/78 , G10L15/065 , G10L15/18
摘要: 公开了用于检测询问结束的包括编码在计算机存储介质上的计算机程序的方法、系统和装置。一方面,一种方法包括接收音频的动作。动作还包括应用询问结束模型。动作还包括确定反映话语是完整话语的可能性的置信度分数。动作还包括将置信度分数与阈值进行比较。动作还包括确定话语是否是很可能完整的。动作还包括提供麦克风指令。这种方法可以增加计算设备对用户的效用,特别是对于具有语音失序或障碍的用户。这种方法也可以节省功率,因为麦克风不需要被激活。也可以避免在基于麦克风检测到的额外音频来解释和执行任务中的计算资源的使用。
-
公开(公告)号:CN112581982B
公开(公告)日:2024-06-25
申请号:CN202011326900.7
申请日:2018-06-06
申请人: 谷歌有限责任公司
发明人: G.西姆科 , M.C.帕拉达圣马丁 , S.M.香农
摘要: 公开了用于检测询问结束的包括编码在计算机存储介质上的计算机程序的方法、系统和装置。公开了一种方法,包括:在数据处理硬件处,接收与用户说出的话语相对应的音频数据;由所述数据处理硬件从所述音频数据中检测所述话语的声学语音特性,所检测到的声学语音特性包括音调和语音速率;由所述数据处理硬件使用询问结束模型基于所述话语的声学语音特性来确定所述话语的置信度分数,所述置信度分数指示所述话语是完整话语的可能性,并且所述询问结束模型包括具有一个或多个长短期记忆(LSTM)层的递归神经网络;由所述数据处理硬件确定所述话语的置信度分数是否满足置信度分数阈值;以及当话语的置信度分数满足置信度分数阈值时:由数据处理硬件确定话语是可能完整的;以及由数据处理硬件指令停用正在检测话语的麦克风。
-
公开(公告)号:CN112581982A
公开(公告)日:2021-03-30
申请号:CN202011326900.7
申请日:2018-06-06
申请人: 谷歌有限责任公司
发明人: G.西姆科 , M.C.帕拉达圣马丁 , S.M.香农
摘要: 公开了用于检测询问结束的包括编码在计算机存储介质上的计算机程序的方法、系统和装置。公开了一种方法,包括:在数据处理硬件处,接收与用户说出的话语相对应的音频数据;由所述数据处理硬件从所述音频数据中检测所述话语的声学语音特性,所检测到的声学语音特性包括音调和语音速率;由所述数据处理硬件使用询问结束模型基于所述话语的声学语音特性来确定所述话语的置信度分数,所述置信度分数指示所述话语是完整话语的可能性,并且所述询问结束模型包括具有一个或多个长短期记忆(LSTM)层的递归神经网络;由所述数据处理硬件确定所述话语的置信度分数是否满足置信度分数阈值;以及当话语的置信度分数满足置信度分数阈值时:由数据处理硬件确定话语是可能完整的;以及由数据处理硬件指令停用正在检测话语的麦克风。
-
公开(公告)号:CN110959159A
公开(公告)日:2020-04-03
申请号:CN201880049126.4
申请日:2018-04-09
申请人: 谷歌有限责任公司
发明人: N.D.霍华德 , G.西姆科 , M.C.帕拉达桑马丁 , R.卡尔亚纳森达拉姆 , G.P.阿鲁穆加姆 , S.瓦苏德范
摘要: 一种方法、系统和装置,包括在计算机存储介质上编码的、用于使用神经网络进行分类的计算机程序。一种方法包括接收与话语相对应的音频数据。获得话语的转录。生成音频数据的表示。生成话语的转录的表示。向分类器提供(i)音频数据的表示和(ii)话语的转录的表示,该分类器基于音频数据的给定表示和话语的转录的给定表示,被训练为输出与给定表示相关联的话语是否可能指向自动辅助还是可能不指向自动辅助的指示。
-
-
-
-