-
公开(公告)号:CN106663427B
公开(公告)日:2019-06-28
申请号:CN201580046787.8
申请日:2015-08-28
Applicant: 苹果公司
IPC: G10L15/187 , G10L15/06
CPC classification number: G10L15/183 , G10L13/08 , G10L15/005 , G10L15/063 , G10L15/187 , G10L15/26 , G10L2015/228
Abstract: 本发明提供了用于生成共享发音词典并且使用所述共享发音词典来解释由虚拟助理接收的语音用户输入的系统和过程。在一个实施例中,所述过程可包括从多个用户接收字词或命名实体的发音。所述发音可标记有上下文标签并存储在所述共享发音词典中。所述共享发音词典然后可用于通过以下方式来解释由用户设备接收的语音用户输入:基于与所述用户设备相关联的上下文信息来确定所述共享发音词典的相关子组,并且使用所述共享发音词典的所述确定子组对所述语音用户输入执行语音到文本转换。
-
公开(公告)号:CN109690672A
公开(公告)日:2019-04-26
申请号:CN201780056321.5
申请日:2017-07-14
Applicant: 搜诺思公司
IPC: G10L15/22
CPC classification number: G10L15/30 , G01S5/18 , G06F3/165 , G06F3/167 , G10L15/22 , G10L17/22 , G10L2015/223 , G10L2015/226 , G10L2015/228 , H05B37/02
Abstract: 本文公开了提供与语音命令相对应的上下文信息的示例技术。示例实现可以涉及:接收指示语音命令的语音数据,接收指示语音命令的特征的上下文信息,以及确定与语音命令相对应的设备操作。确定与语音命令相对应的设备操作可以包括:在媒体回放系统的多个区中识别与语音命令的特征相对应的区,以及确定语音命令对应于与所识别的区相关联的一个或更多个特定设备。示例实现还可以涉及:使一个或更多个特定设备执行设备操作。
-
公开(公告)号:CN108428450A
公开(公告)日:2018-08-21
申请号:CN201710082715.X
申请日:2017-02-15
Applicant: 阿里巴巴集团控股有限公司
IPC: G10L15/22
CPC classification number: G10L15/22 , G10L2015/223 , G10L2015/225 , G10L2015/226 , G10L2015/228
Abstract: 本申请公开了一种操作指令处理方法及装置。本申请中,对输入的语音进行识别,得到所请求执行的操作指令;根据所述操作指令的类型以及所处的场景,判断所述所处的场景是否是与执行所述类型的所述操作指令相匹配的场景;若判定为是,则执行所述操作指令,否则,根据所述操作指令和/或所述所处的场景输出匹配的语音提示信息。采用本申请可使得语音提示信息能够对用户进行有效引导。
-
公开(公告)号:CN104919522B
公开(公告)日:2018-04-27
申请号:CN201380069684.4
申请日:2013-11-07
Applicant: 纽昂斯通讯公司
Inventor: 马蒂厄·赫伯特 , 让-菲利浦·罗比肖 , 克里斯多佛·M·帕里西安
IPC: G10L15/30
CPC classification number: G06F17/30654 , G06F17/2765 , G06F17/279 , G10L15/1815 , G10L15/1822 , G10L15/22 , G10L15/30 , G10L2015/085 , G10L2015/228
Abstract: 描述了一种用于分布式自然语言处理的系统和对应方法。一组本地数据源存储在移动设备上。移动设备上的本地自然语言理解(NLU)匹配模块执行结合本地数据源的自然语言输入的自然语言处理,以确定一个或多个本地解释候选。移动设备上的本地NLU排名模块处理本地解释候选和来自远程NLU服务器的一个或多个远程解释候选,以确定对应于自然语言输入的最终输出解释。
-
公开(公告)号:CN107924679A
公开(公告)日:2018-04-17
申请号:CN201680041199.X
申请日:2016-07-12
Applicant: 微软技术许可有限责任公司
CPC classification number: G10L15/183 , G10L15/08 , G10L15/14 , G10L15/18 , G10L15/1822 , G10L15/22 , G10L15/24 , G10L15/32 , G10L2015/228
Abstract: 本公开内容的示例描述输入理解系统/服务的处理。接收的输入被处理以生成用于识别接收的输入的备选的集合。备选的集合被过滤。过滤包括对备选的集合排名并且传播多个排名的备选以用于附加处理。传播的备选被处理以基于接收的输入来生成用于潜在假设的备选的扩展的集合。备选的扩展的集合被过滤。过滤包括对扩展的集合的备选排名并且传播扩展的集合的多个排名的备选以用于附加处理。扩展的集合的传播的备选基于对从外部资源取读的知识数据的应用被评估。对接收的输入的响应被生成。响应的生成包括对评估的备选排名并且基于排名并且评估的备选来选择响应。
-
公开(公告)号:CN105446489B
公开(公告)日:2017-09-22
申请号:CN201510900408.9
申请日:2015-12-08
Applicant: 广州神马移动信息科技有限公司
IPC: G06F3/01 , G06F3/0481 , G10L15/22
CPC classification number: G10L15/22 , G06F3/04817 , G06F3/0482 , G06F3/04847 , G06F3/04883 , G06F3/167 , G10L15/05 , G10L15/32 , G10L2015/223 , G10L2015/228
Abstract: 本发明实施例提出的语音双模控制方法、装置及用户终端,属于控制技术领域。其中,所述方法包括:监测用户在语音输入界面下是否执行启动操作说判停模式的操作;在监测到用户执行启动操作说判停模式的操作时,判断麦克风是否处于忙碌状态,如果是,则将语音模式从直接说自动判停模式切换为操作说判停模式,其中,在用户执行启动操作说判停模式的操作之前,若麦克风处于忙碌状态,则语音模式为直接说自动判停模式。本发明实施例提供的方案在同时支持“操作说”和“直接说”两种语音输入方式的应用场景下,通过对用户操作行为和麦克风状态的监测,灵活可靠地选择语音模式及完成模式切换,能够较好地适配不同用户的语音输入习惯。
-
公开(公告)号:CN104040620B
公开(公告)日:2017-07-14
申请号:CN201180076089.4
申请日:2011-12-29
Applicant: 英特尔公司
IPC: G10L15/22 , G10L15/183 , G06F3/16 , G06F3/01 , G06F3/0488
CPC classification number: B60R16/0373 , B60W2420/42 , B60W2540/02 , G06F3/017 , G06F3/04883 , G06F3/167 , G06F2203/0381 , G06F2203/04108 , G06K9/00355 , G10L15/183 , G10L15/22 , G10L2015/228
Abstract: 提供了语音识别系统和/或技术,其中将语法元素和/或语音输入的目标定为选定功能。一个或多个输入捕获设备便于收集与车辆相关联的用户输入,且车辆功能可基于所接收的用户输入来选择。与选定功能的可听命令相关联的可用语法元素的子集可接着被识别并用于评估所接收的音频输入。在这个方面,语音识别的目标可被定为选定功能。
-
公开(公告)号:CN103258534B
公开(公告)日:2017-07-07
申请号:CN201210113293.5
申请日:2012-04-17
Applicant: 联发科技股份有限公司
IPC: G10L15/26
CPC classification number: G10L15/22 , G10L2015/223 , G10L2015/228
Abstract: 本发明提供一种语音命令识别方法,其特征在于,包括:从浏览文件的多个与命令相关的文本字符串中选择多个候选文本字符串;为每个候选文本字符串准备候选语音字符串;接收语音命令;从多个候选语音字符串中搜索匹配所述语音命令的目标语音字符串,其中所述目标语音字符串对应于所述多个候选文本字符串中的目标文本字符串;以及执行与所述目标文本字符串相关的命令。通过利用本发明,可使浏览文件更加简便和直观。
-
公开(公告)号:CN106851087A
公开(公告)日:2017-06-13
申请号:CN201611087113.5
申请日:2016-12-01
Applicant: 佳能株式会社
Inventor: 梅泽岳央
IPC: H04N5/232
CPC classification number: G10L15/22 , G01H3/125 , G06K9/00771 , G10L2015/228 , H04R1/326 , H04R29/00 , H04R29/008 , H04S7/40 , H04N5/23216 , H04N5/23229
Abstract: 本发明提供一种信息处理装置和信息处理方法。该信息处理装置包括:获得单元,其被构造为获得由摄像单元拍摄的图像;检测单元,其被构造为根据由声音收集单元获得的音频数据检测与检测目标相对应的目标声音;区域估计单元,其被构造为基于声音收集单元的方向性和与产生目标声音的目标声源的位置相距的距离中的至少一者,估计由拍摄图像表示的区域中的能够检测到目标声音的可检测区域;以及生成单元,其被构造为生成表示可检测区域的区域图像。
-
公开(公告)号:CN104737226B
公开(公告)日:2017-06-06
申请号:CN201380053806.0
申请日:2013-05-18
IPC: G10L15/32 , G01C21/36 , G10L15/30 , B60R16/037 , G10L15/22
CPC classification number: G10L15/32 , B60R16/0373 , G01C21/3608 , G10L15/30 , G10L2015/228
Abstract: 本发明涉及一种用于在机动车(10)中进行语音识别的方法。接收用户(22)的语音输入(26),在不向用户(22)提出询问的情况下将至少一个所接收的语音输入传输给车辆内部的车载‑语音识别器(46)。由此产生第一识别结果(48),但该第一识别结果并不总是正确的,因此需要询问用户或由用户作出校正。本发明的目的在于,在机动车(10)中提供可靠的语音识别,其使得机动车中的用户尽可能少地从交通现状中分心。为此,由处理装置(32)将语音输入(54)全部或部分地也传输给车辆外部的非车载‑语音识别器(12),并由处理装置(32)从该非车载‑语音识别器接收第二识别结果(56),由处理装置(32)根据第一识别结果(48)和第二识别结果(56)确定语言文本(34)。
-
-
-
-
-
-
-
-
-