Patent search cpc:"G10L2015/221" Page 1

1.

发明申请
SPEECH RECOGNITION 审中-公开
Title translation: 语音识别

公开(公告)号：WO2017151417A1

公开(公告)日：2017-09-08

申请号：PCT/US2017/019270

申请日：2017-02-24

Applicant: MICROSOFT TECHNOLOGY LICENSING, LLC

Inventor： FROELICH, Raymond, J.

IPC: G10L15/22 , G10L15/08 , G10L15/19 , G10L15/183 , G06F17/27

CPC classification number: G10L15/222 , G06F17/2785 , G10L15/02 , G10L15/063 , G10L15/22 , G10L15/26 , G10L25/87 , G10L2015/0635 , G10L2015/221 , G10L2015/225

Abstract: A computer system comprises an input configured to receive voice input from a user, the voice input having speech intervals separated by non-speech intervals; an ASR system configured to identify individual words in the voice input during speech intervals of the voice input, and store the identified words in memory; a speech overload detection module configured to detect at a time during a speech interval of the voice input a speech overload condition; and a notification module configured to output to the user, in response to said to detection, a notification of the speech overload condition.

Abstract translation: 计算机系统包括被配置为接收来自用户的语音输入的输入，该语音输入具有由非语音间隔分开的语音区间; ASR系统，其被配置为在语音输入的语音区间期间识别语音输入中的单独单词，并将所识别的单词存储在存储器中; 语音过载检测模块，被配置为在语音输入的语音区间期间一次检测语音过载状况; 以及通知模块，被配置为响应于所述检测而向用户输出语音过载状况的通知。

2.

发明申请
INTELLIGENT AUTOMATED ASSISTANT FOR MEDIA SEARCH AND PLAYBACK 审中-公开
Title translation: 智能搜索和回放的智能自动化助理

公开(公告)号：WO2017044260A1

公开(公告)日：2017-03-16

申请号：PCT/US2016/047215

申请日：2016-08-16

Applicant: APPLE INC.

Inventor： ORR, Ryan, M. , SIDKI, Raumi, N. , LISTER, Patrick, M. , RUSSELL, Jonathan, H.

IPC: G06F17/30

CPC classification number: G06F17/30038 , G06F3/167 , G06F17/28 , G06F17/3005 , G06F17/30654 , G06F17/30976 , G10L15/22 , G10L15/265 , G10L2015/221 , H04N5/4403 , H04N21/4126 , H04N21/42203 , H04N21/42204 , H04N21/42207 , H04N21/4828 , H04N2005/4423 , H04N2005/4428 , H04N2005/443 , H04N2005/4432

Abstract: Systems and processes are disclosed for operating a digital assistant for media search and playback. In an exemplary process, an audio input containing a media search request can be received. A primary user intent corresponding to the media search request can be determined and one or more secondary user intents based on one or more previous user intents can be determined. A primary set of media items corresponding to the primary user intent can be displayed and one or more secondary sets of media items corresponding to the one or more secondary user intents can be displayed.

Abstract translation: 公开了用于操作用于媒体搜索和重放的数字助理的系统和过程。在示例性过程中，可以接收包含媒体搜索请求的音频输入。可以确定与媒体搜索请求相对应的主要用户意图，并且可以确定基于一个或多个先前用户意图的一个或多个次要用户意图。可以显示与主用户意图相对应的主要媒体项目，并且可以显示与一个或多个次用户意图对应的一个或多个媒体项目的一个或多个辅助集。

3.

发明申请
車載用音声認識装置および車載機器审中-公开
Title translation: 车载语音识别装置和车载设备

公开(公告)号：WO2017042906A1

公开(公告)日：2017-03-16

申请号：PCT/JP2015/075595

申请日：2015-09-09

Applicant: 三菱電機株式会社

Inventor： 竹裏　尚嘉

IPC: G10L15/22 , G10L15/00 , G10L15/28

CPC classification number: G10L15/22 , G10L25/78 , G10L2015/221 , G10L2015/223 , G10L2015/226

Abstract: 音声認識部は、音声を予め設定された期間において認識する。判断部は、車内の発話者の人数が複数か単数かを判断する。認識制御部は、発話者の人数が複数の場合、発話開始の指示を受けた後に発話された音声の認識結果を採用し、単数の場合は当該指示を受けた後に発話された音声の認識結果であっても当該指示を受けていないときに発話された音声の認識結果であっても採用する。制御部は、認識制御部が採用した認識結果に応じた動作を行う。

Abstract translation: 语音识别单元在预定时段期间识别语音。确定单元确定车辆中是否存在单个扬声器或多个扬声器。当车辆中有多个扬声器时，识别控制单元在接收到说话开始的指令之后，采用产生的语音识别结果。当车辆中存在单个扬声器时，识别控制单元采用语音识别结果，即在接收到指令之后是否产生语音，或者在不接收到指令的情况下产生语音。控制单元根据识别控制单元采用的识别结果执行操作。

4.

发明申请
移動支援装置、移動支援用サーバおよび移動支援システム审中-公开
Title translation: 旅行辅助装置，行驶辅助服务器和行驶辅助系统

公开(公告)号：WO2016194206A1

公开(公告)日：2016-12-08

申请号：PCT/JP2015/066232

申请日：2015-06-04

Applicant: 三菱電機株式会社

Inventor： 菅原　永

IPC: G08G1/01 , G01C21/26 , G06Q30/02 , G06Q50/10 , G08G1/13 , G09B29/00

CPC classification number: G06Q30/0282 , G01C21/3461 , G01C21/36 , G01C21/3691 , G06Q30/02 , G06Q50/10 , G08G1/01 , G08G1/13 , G09B29/00 , G09B29/007 , G10L15/22 , G10L25/78 , G10L2015/221 , G10L2015/223

Abstract: 移動支援装置は、ユーザの発話音声を取得および認識して認識結果を出力する音声情報検出部と、認識結果から評価情報を生成する情報処理部と、評価情報を生成した位置を検出する位置情報検出部と、現在日時を基準とした予め定められた期間内に評価情報を生成した位置を基準とした予め定められた距離範囲内からインターネット上に投稿された投稿情報を用いて、評価情報の信憑性を判定して送信可能か否かを判定する信憑性判定部と、信憑性判定部が送信すると判定した評価情報の移動支援用サーバへの送信、移動支援用サーバが記憶している評価情報の受信、およびインターネット上に投稿された投稿情報の受信を行う通信部と、通信部が移動支援用サーバから受信した評価情報を提供する情報提供部とを備える。

Abstract translation: 提供一种旅行辅助装置，包括：语音信息检测单元，其获取并识别用户的语音发声，并输出识别结果; 信息处理单元，从识别结果生成评价信息; 位置信息检测单元，其检测产生评估信息的位置; 可靠性确定单元，其以在当前日期和时间为参考的预定间隔内以及在与产生评估信息的位置作为参考的距离的预定距离范围内张贴在因特网上的发布信息确定评估信息的可靠性并确定其传输是否允许; 执行向旅行援助服务器传送可靠性确定单元已经确定要发送的评估信息，旅行援助服务器存储的评估信息的接收以及发布的发布信息的接收的通信单元在网上; 以及信息提供单元，其提供通信单元从旅行辅助服务器接收的评估信息。

5.

发明申请
MULTI-COMMAND SINGLE UTTERANCE INPUT METHOD 审中-公开
Title translation: 多命令单输入法

公开(公告)号：WO2015184186A1

公开(公告)日：2015-12-03

申请号：PCT/US2015/033051

申请日：2015-05-28

Applicant: APPLE INC.

Inventor： GRUBER, Thomas, R. , SADDLER, Harry, J. , BELLEGARDA, Jerome, R. , NYEGGEN, Bryce, H. , SABATELLI, Alessandro

IPC: G10L15/18 , G10L15/26 , G10L15/28 , G10L15/08 , G10L15/22

CPC classification number: G10L15/1822 , G06F17/2705 , G10L15/1815 , G10L15/26 , G10L15/28 , G10L2015/088 , G10L2015/221 , G10L2015/223 , G10L2015/225 , G10L2015/228

Abstract: Systems and processes are disclosed for handling a multi-part voice command for a virtual assistant. Speech input can be received from a user that includes multiple actionable commands within a single utterance. A text string can be generated from the speech input using a speech transcription process. The text string can be parsed into multiple candidate substrings based on domain keywords, imperative verbs, predetermined substring lengths, or the like. For each candidate substring, a probability can be determined indicating whether the candidate substring corresponds to an actionable command. Such probabilities can be determined based on semantic coherence, similarity to user request templates, querying services to determine manageability, or the like. If the probabilities exceed a threshold, the user intent of each substring can be determined, processes associated with the user intents can be executed, and an acknowledgment can be provided to the user.

Abstract translation: 公开了用于处理虚拟助理的多部分语音命令的系统和过程。语音输入可以从包含单个话语中的多个可操作命令的用户接收。可以使用语音转录过程从语音输入生成文本串。文本字符串可以基于域关键字，命令动词，预定子字符长度等被解析成多个候选子字符串。对于每个候选子串，可以确定指示候选子串是否对应于可动作命令的概率。这样的概率可以基于语义一致性，与用户请求模板的相似性，查询服务以确定可管理性等来确定。如果概率超过阈值，则可以确定每个子串的用户意图，可以执行与用户意图相关联的过程，并且可以向用户提供确认。

6.

发明申请
ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム审中-公开
Title translation: 用户界面系统，用户界面控制装置，用户界面控制方法和用户界面控制程序

公开(公告)号：WO2015162638A1

公开(公告)日：2015-10-29

申请号：PCT/JP2014/002263

申请日：2014-04-22

Applicant: 三菱電機株式会社

Inventor： 平井　正人

IPC: G06F3/16 , G01C21/36

CPC classification number: G06F3/167 , G01C21/3608 , G06F3/04842 , G10L15/22 , G10L2015/221 , G10L2015/228

Abstract: 　本発明は、音声入力を行うユーザの操作負荷を軽減することを目的とする。この目的を達成するため、本発明に係るユーザインターフェースシステムは、現在の状況に関する情報に基づいてユーザの音声操作の意図を推定する推定部３と、推定部３で推定された複数の音声操作の候補から１つの候補をユーザが選択するための候補選択部５と、ユーザが選択した候補についてユーザの音声入力を促すガイダンスを出力するガイダンス出力部７と、ガイダンスに対するユーザの音声入力に対応する機能を実行する機能実行部１０とを備える。

Abstract translation: 本发明的目的是减轻执行语音输入的用户的操作负担。为了实现上述目的，该用户接口系统具备：估计单元（3），其基于与当前情况相关的信息来估计用户的语音操作意图; 候选选择单元（5），用于用户从由所述估计单元（3）估计的多个语音操作候选中选择一个候选; 引导输出单元（7），其输出用于提示用户关于由用户选择的候选者的语音输入的指导; 以及功能执行单元（10），其响应于引导执行与用户的语音输入相对应的功能。

7.

发明申请
METHOD FOR ACQUIRING AT LEAST TWO PIECES OF INFORMATION TO BE ACQUIRED, COMPRISING INFORMATION CONTENT TO BE LINKED, USING A SPEECH DIALOGUE DEVICE, SPEECH DIALOGUE DEVICE, AND MOTOR VEHICLE 审中-公开
Title translation: 用于确定至少两个方法来覆盖SANTANDER的信息与你VERKNÜPFENDEM信息内容按语言对话建立，语言对话装置和机动车

公开(公告)号：WO2015124259A1

公开(公告)日：2015-08-27

申请号：PCT/EP2015000185

申请日：2015-01-31

Applicant: AUDI AG

Inventor： MÖGELE HANNES , PFLEGER NORBERT , SCHEL JAN

IPC: G10L15/22

CPC classification number: G10L15/222 , B60R16/0373 , G10L13/00 , G10L15/18 , G10L15/22 , G10L2015/221 , G10L2015/223 , G10L2015/225 , G10L2015/228

Abstract: The invention relates to a method for acquiring at least two pieces of information to be acquired, comprising information content to be linked, using a speech dialogue device. A speech output is produced by the speech dialogue device between each acquisition of information. Each piece of information is acquired by acquiring natural vocal speech input data and by extracting the respective information from the speech input data using a speech recognition algorithm. When a repetition condition has been satisfied, a natural speech summary output is generated by the speech dialogue device and output as speech output which comprises a natural vocal reproduction of at least one previously acquired piece of information or a part of said piece of information or a piece of information derived from said piece of information.

Abstract translation: 待检测一种用于检测至少两种方法与由语音对话装置太verknüpfendem信息内容的信息，需要在每种情况下的信息的检测之间的地方，由话音通信装置的话音输出，由检测自然语言语音的输入数据和从声音输入数据的相关信息提取由每种情况下的信息语音识别算法被记录，其中的重复条件成立时产生由语音对话装置和作为声音输出输出的自然语言摘要输出，包括以下中的至少一个已经获取的信息或该信息或从该信息导出的值部分的自然语言再现。

8.

发明申请
SEARCH RESULTS USING INTONATION NUANCES 审中-公开
Title translation: 使用INT ATION。。。。。。

公开(公告)号：WO2014158831A1

公开(公告)日：2014-10-02

申请号：PCT/US2014/020444

申请日：2014-03-05

Applicant: MICROSOFT CORPORATION

Inventor： COUSSEMAEKER, Didier , DENIEL, Loic , KONG, Hoon , MAI, Nicolas , KRISHNAMOORTHY, Narayan , NA, Ty, Long

IPC: G06F17/30 , G06Q30/02

CPC classification number: G06F17/30401 , G06F17/30528 , G06F17/30554 , G06F17/30764 , G06F17/30867 , G06Q30/0251 , G06Q30/0269 , G10L15/06 , G10L15/22 , G10L15/26 , G10L15/265 , G10L15/32 , G10L17/26 , G10L25/00 , G10L25/63 , G10L25/75 , G10L2015/221

Abstract: Systems and methods for responding to an audio query are presented. More particularly, vocalization nuances of a vocalized search query (audio query) are identified are utilized in responding to the audio query. In addition to converting the audio query to a textual representation, vocalization nuances of the audio query are identified. Search results are identified according to the textual representation of the audio query and in light of the vocalization nuances. A search results presentation is prepared in response to the audio query, where the search results presentation is based on the identified search results and also based on the vocalization nuances. The search results presentation is returned in response to the audio query.

Abstract translation: 介绍了响应音频查询的系统和方法。更具体地，识别出发声搜索查询（音频查询）的发音细微差别来响应音频查询。除了将音频查询转换为文本表示之外，还识别音频查询的发音细微差别。搜索结果根据音频查询的文本表示，并根据发声的细微差别进行识别。响应于音频查询准备搜索结果表示，其中搜索结果呈现基于所识别的搜索结果，并且还基于发声细微差别。响应于音频查询返回搜索结果表示。

9.

发明申请
온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법 审中-公开
Title translation: 用于处理在线语音识别，语音识别服务器系统和语音识别方法的语音识别客户端系统

公开(公告)号：WO2012081788A1

公开(公告)日：2012-06-21

申请号：PCT/KR2011/005394

申请日：2011-07-21

Applicant: 엔에이치엔(주) , 이상호 , 김훈 , 구동욱 , 김준석 , 김상경

Inventor： 이상호 , 김훈 , 구동욱 , 김준석 , 김상경

IPC: G10L15/22 , G06F15/00

CPC classification number: G10L15/22 , G10L15/01 , G10L15/08 , G10L15/30 , G10L2015/221

Abstract: 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법이 개시된다. 음성인식의 시작시점부터 종료시점까지 입력되는 소리신호에 대한 음성인식 결과를 표시하는 음성인식 클라이언트 시스템은, 시작시점부터 종료시점까지 기선정된 단위시간마다 입력되는 단위소리신호를 단위시간마다 음성인식 서버 시스템으로 전송하고, 음성인식 서버 시스템으로부터 음성인식 중간 결과를 수신하는 통신부 및 수신된 음성인식 중간 결과를 시작시점과 종료시점 사이에 표시하는 표시부를 포함한다.

Abstract translation: 公开了用于处理在线语音识别的语音识别客户端系统，语音识别服务器系统和语音识别方法。语音识别客户端系统，其指示从用于语音识别的开始时间到结束时间输入的语音信号中的语音识别的结果，包括：通信单元，其发送以预定的间隔的间隔输入的单元语音信号从起始时间到结束时间的时间到语音识别服务器系统，并且从语音识别服务器系统接收语音识别的中间结果; 以及显示单元，其显示在开始时间和结束时间之间接收到的中间结果。

10.

发明申请
GENIUS BUTTON SECONDARY COMMANDS 审中-公开
Title translation: 一般按钮二级命令

公开(公告)号：WO2012021201A1

公开(公告)日：2012-02-16

申请号：PCT/US2011/037927

申请日：2011-05-25

Applicant: T-MOBILE USA, INC. , LAU, Kevin , SMITH, Desmond

Inventor： LAU, Kevin , SMITH, Desmond

IPC: G06F3/16 , G06F3/01 , H04B1/40

CPC classification number: H04M3/42127 , G10L13/00 , G10L15/22 , G10L15/265 , G10L2015/221 , G10L2015/223 , G10L2015/228 , H04M1/271 , H04M1/72522 , H04M1/72552 , H04M1/72558 , H04M3/42034 , H04M3/42382 , H04M3/541 , H04M2250/74 , H04W4/025 , H04W4/14

Abstract: Methods, systems and articles for receiving, by a telecommunication device, audio input through a unified audio interface are disclosed herein. The telecommunication device is further configured to perform at least one of a dictation action, an incoming message processing action, a navigation action, a content lookup action, or a contact lookup action while continuously or substantially continuously receiving voice commands from a user. In some aspects, the telecommunications device may continuously receive and process voice command while operating in a driving mode, which may be initiated by the telecommunications device.

Abstract translation: 本文公开了用于通过电信设备接收通过统一音频接口的音频输入的方法，系统和物品。电信设备还被配置为在从用户连续地或基本上连续地接收语音命令的同时执行听写动作，输入消息处理动作，导航动作，内容查找动作或联系人查找动作中的至少一个。在一些方面，电信设备可以在可以由电信设备启动的驱动模式下操作时连续地接收和处理语音命令。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification