SPEECH RECOGNITION
    1.
    发明申请
    SPEECH RECOGNITION 审中-公开
    语音识别

    公开(公告)号:WO2017151417A1

    公开(公告)日:2017-09-08

    申请号:PCT/US2017/019270

    申请日:2017-02-24

    Abstract: A computer system comprises an input configured to receive voice input from a user, the voice input having speech intervals separated by non-speech intervals; an ASR system configured to identify individual words in the voice input during speech intervals of the voice input, and store the identified words in memory; a speech overload detection module configured to detect at a time during a speech interval of the voice input a speech overload condition; and a notification module configured to output to the user, in response to said to detection, a notification of the speech overload condition.

    Abstract translation: 计算机系统包括被配置为接收来自用户的语音输入的输入,该语音输入具有由非语音间隔分开的语音区间; ASR系统,其被配置为在语音输入的语音区间期间识别语音输入中的单独单词,并将所识别的单词存储在存储器中; 语音过载检测模块,被配置为在语音输入的语音区间期间一次检测语音过载状况; 以及通知模块,被配置为响应于所述检测而向用户输出语音过载状况的通知。

    車載用音声認識装置および車載機器
    3.
    发明申请
    車載用音声認識装置および車載機器 审中-公开
    车载语音识别装置和车载设备

    公开(公告)号:WO2017042906A1

    公开(公告)日:2017-03-16

    申请号:PCT/JP2015/075595

    申请日:2015-09-09

    Inventor: 竹裏 尚嘉

    Abstract: 音声認識部は、音声を予め設定された期間において認識する。判断部は、車内の発話者の人数が複数か単数かを判断する。認識制御部は、発話者の人数が複数の場合、発話開始の指示を受けた後に発話された音声の認識結果を採用し、単数の場合は当該指示を受けた後に発話された音声の認識結果であっても当該指示を受けていないときに発話された音声の認識結果であっても採用する。制御部は、認識制御部が採用した認識結果に応じた動作を行う。

    Abstract translation: 语音识别单元在预定时段期间识别语音。 确定单元确定车辆中是否存在单个扬声器或多个扬声器。 当车辆中有多个扬声器时,识别控制单元在接收到说话开始的指令之后,采用产生的语音识别结果。 当车辆中存在单个扬声器时,识别控制单元采用语音识别结果,即在接收到指令之后是否产生语音,或者在不接收到指令的情况下产生语音。 控制单元根据识别控制单元采用的识别结果执行操作。

    移動支援装置、移動支援用サーバおよび移動支援システム
    4.
    发明申请
    移動支援装置、移動支援用サーバおよび移動支援システム 审中-公开
    旅行辅助装置,行驶辅助服务器和行驶辅助系统

    公开(公告)号:WO2016194206A1

    公开(公告)日:2016-12-08

    申请号:PCT/JP2015/066232

    申请日:2015-06-04

    Inventor: 菅原 永

    Abstract: 移動支援装置は、ユーザの発話音声を取得および認識して認識結果を出力する音声情報検出部と、認識結果から評価情報を生成する情報処理部と、評価情報を生成した位置を検出する位置情報検出部と、現在日時を基準とした予め定められた期間内に評価情報を生成した位置を基準とした予め定められた距離範囲内からインターネット上に投稿された投稿情報を用いて、評価情報の信憑性を判定して送信可能か否かを判定する信憑性判定部と、信憑性判定部が送信すると判定した評価情報の移動支援用サーバへの送信、移動支援用サーバが記憶している評価情報の受信、およびインターネット上に投稿された投稿情報の受信を行う通信部と、通信部が移動支援用サーバから受信した評価情報を提供する情報提供部とを備える。

    Abstract translation: 提供一种旅行辅助装置,包括:语音信息检测单元,其获取并识别用户的语音发声,并输出识别结果; 信息处理单元,从识别结果生成评价信息; 位置信息检测单元,其检测产生评估信息的位置; 可靠性确定单元,其以在当前日期和时间为参考的预定间隔内以及在与产生评估信息的位置作为参考的距离的预定距离范围内张贴在因特网上的发布信息确定 评估信息的可靠性并确定其传输是否允许; 执行向旅行援助服务器传送可靠性确定单元已经确定要发送的评估信息,旅行援助服务器存储的评估信息的接收以及发布的发布信息的接收的通信单元 在网上; 以及信息提供单元,其提供通信单元从旅行辅助服务器接收的评估信息。

    MULTI-COMMAND SINGLE UTTERANCE INPUT METHOD
    5.
    发明申请
    MULTI-COMMAND SINGLE UTTERANCE INPUT METHOD 审中-公开
    多命令单输入法

    公开(公告)号:WO2015184186A1

    公开(公告)日:2015-12-03

    申请号:PCT/US2015/033051

    申请日:2015-05-28

    Applicant: APPLE INC.

    Abstract: Systems and processes are disclosed for handling a multi-part voice command for a virtual assistant. Speech input can be received from a user that includes multiple actionable commands within a single utterance. A text string can be generated from the speech input using a speech transcription process. The text string can be parsed into multiple candidate substrings based on domain keywords, imperative verbs, predetermined substring lengths, or the like. For each candidate substring, a probability can be determined indicating whether the candidate substring corresponds to an actionable command. Such probabilities can be determined based on semantic coherence, similarity to user request templates, querying services to determine manageability, or the like. If the probabilities exceed a threshold, the user intent of each substring can be determined, processes associated with the user intents can be executed, and an acknowledgment can be provided to the user.

    Abstract translation: 公开了用于处理虚拟助理的多部分语音命令的系统和过程。 语音输入可以从包含单个话语中的多个可操作命令的用户接收。 可以使用语音转录过程从语音输入生成文本串。 文本字符串可以基于域关键字,命令动词,预定子字符长度等被解析成多个候选子字符串。 对于每个候选子串,可以确定指示候选子串是否对应于可动作命令的概率。 这样的概率可以基于语义一致性,与用户请求模板的相似性,查询服务以确定可管理性等来确定。 如果概率超过阈值,则可以确定每个子串的用户意图,可以执行与用户意图相关联的过程,并且可以向用户提供确认。

    ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム
    6.
    发明申请

    公开(公告)号:WO2015162638A1

    公开(公告)日:2015-10-29

    申请号:PCT/JP2014/002263

    申请日:2014-04-22

    Inventor: 平井 正人

    Abstract:  本発明は、音声入力を行うユーザの操作負荷を軽減することを目的とする。この目的を達成するため、本発明に係るユーザインターフェースシステムは、現在の状況に関する情報に基づいてユーザの音声操作の意図を推定する推定部3と、推定部3で推定された複数の音声操作の候補から1つの候補をユーザが選択するための候補選択部5と、ユーザが選択した候補についてユーザの音声入力を促すガイダンスを出力するガイダンス出力部7と、ガイダンスに対するユーザの音声入力に対応する機能を実行する機能実行部10とを備える。

    Abstract translation: 本发明的目的是减轻执行语音输入的用户的操作负担。 为了实现上述目的,该用户接口系统具备:估计单元(3),其基于与当前情况相关的信息来估计用户的语音操作意图; 候选选择单元(5),用于用户从由所述估计单元(3)估计的多个语音操作候选中选择一个候选; 引导输出单元(7),其输出用于提示用户关于由用户选择的候选者的语音输入的指导; 以及功能执行单元(10),其响应于引导执行与用户的语音输入相对应的功能。

    METHOD FOR ACQUIRING AT LEAST TWO PIECES OF INFORMATION TO BE ACQUIRED, COMPRISING INFORMATION CONTENT TO BE LINKED, USING A SPEECH DIALOGUE DEVICE, SPEECH DIALOGUE DEVICE, AND MOTOR VEHICLE
    7.
    发明申请
    METHOD FOR ACQUIRING AT LEAST TWO PIECES OF INFORMATION TO BE ACQUIRED, COMPRISING INFORMATION CONTENT TO BE LINKED, USING A SPEECH DIALOGUE DEVICE, SPEECH DIALOGUE DEVICE, AND MOTOR VEHICLE 审中-公开
    用于确定至少两个方法来覆盖SANTANDER的信息与你VERKNÜPFENDEM信息内容按语言对话建立,语言对话装置和机动车

    公开(公告)号:WO2015124259A1

    公开(公告)日:2015-08-27

    申请号:PCT/EP2015000185

    申请日:2015-01-31

    Applicant: AUDI AG

    Abstract: The invention relates to a method for acquiring at least two pieces of information to be acquired, comprising information content to be linked, using a speech dialogue device. A speech output is produced by the speech dialogue device between each acquisition of information. Each piece of information is acquired by acquiring natural vocal speech input data and by extracting the respective information from the speech input data using a speech recognition algorithm. When a repetition condition has been satisfied, a natural speech summary output is generated by the speech dialogue device and output as speech output which comprises a natural vocal reproduction of at least one previously acquired piece of information or a part of said piece of information or a piece of information derived from said piece of information.

    Abstract translation: 待检测一种用于检测至少两种方法与由语音对话装置太verknüpfendem信息内容的信息,需要在每种情况下的信息的检测之间的地方,由话音通信装置的话音输出,由检测自然语言语音的输入数据和从声音输入数据的相关信息提取由每种情况下的信息 语音识别算法被记录,其中的重复条件成立时产生由语音对话装置和作为声音输出输出的自然语言摘要输出,包括以下中的至少一个已经获取的信息或该信息或从该信息导出的值部分的自然语言再现。

    SEARCH RESULTS USING INTONATION NUANCES
    8.
    发明申请
    SEARCH RESULTS USING INTONATION NUANCES 审中-公开
    使用INT ATION。。。。。。

    公开(公告)号:WO2014158831A1

    公开(公告)日:2014-10-02

    申请号:PCT/US2014/020444

    申请日:2014-03-05

    Abstract: Systems and methods for responding to an audio query are presented. More particularly, vocalization nuances of a vocalized search query (audio query) are identified are utilized in responding to the audio query. In addition to converting the audio query to a textual representation, vocalization nuances of the audio query are identified. Search results are identified according to the textual representation of the audio query and in light of the vocalization nuances. A search results presentation is prepared in response to the audio query, where the search results presentation is based on the identified search results and also based on the vocalization nuances. The search results presentation is returned in response to the audio query.

    Abstract translation: 介绍了响应音频查询的系统和方法。 更具体地,识别出发声搜索查询(音频查询)的发音细微差别来响应音频查询。 除了将音频查询转换为文本表示之外,还识别音频查询的发音细微差别。 搜索结果根据音频查询的文本表示,并根据发声的细微差别进行识别。 响应于音频查询准备搜索结果表示,其中搜索结果呈现基于所识别的搜索结果,并且还基于发声细微差别。 响应于音频查询返回搜索结果表示。

    온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법
    9.
    发明申请
    온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법 审中-公开
    用于处理在线语音识别,语音识别服务器系统和语音识别方法的语音识别客户端系统

    公开(公告)号:WO2012081788A1

    公开(公告)日:2012-06-21

    申请号:PCT/KR2011/005394

    申请日:2011-07-21

    CPC classification number: G10L15/22 G10L15/01 G10L15/08 G10L15/30 G10L2015/221

    Abstract: 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법이 개시된다. 음성인식의 시작시점부터 종료시점까지 입력되는 소리신호에 대한 음성인식 결과를 표시하는 음성인식 클라이언트 시스템은, 시작시점부터 종료시점까지 기선정된 단위시간마다 입력되는 단위소리신호를 단위시간마다 음성인식 서버 시스템으로 전송하고, 음성인식 서버 시스템으로부터 음성인식 중간 결과를 수신하는 통신부 및 수신된 음성인식 중간 결과를 시작시점과 종료시점 사이에 표시하는 표시부를 포함한다.

    Abstract translation: 公开了用于处理在线语音识别的语音识别客户端系统,语音识别服务器系统和语音识别方法。 语音识别客户端系统,其指示从用于语音识别的开始时间到结束时间输入的语音信号中的语音识别的结果,包括:通信单元,其发送以预定的间隔的间隔输入的单元语音信号 从起始时间到结束时间的时间到语音识别服务器系统,并且从语音识别服务器系统接收语音识别的中间结果; 以及显示单元,其显示在开始时间和结束时间之间接收到的中间结果。

    GENIUS BUTTON SECONDARY COMMANDS
    10.
    发明申请
    GENIUS BUTTON SECONDARY COMMANDS 审中-公开
    一般按钮二级命令

    公开(公告)号:WO2012021201A1

    公开(公告)日:2012-02-16

    申请号:PCT/US2011/037927

    申请日:2011-05-25

    Abstract: Methods, systems and articles for receiving, by a telecommunication device, audio input through a unified audio interface are disclosed herein. The telecommunication device is further configured to perform at least one of a dictation action, an incoming message processing action, a navigation action, a content lookup action, or a contact lookup action while continuously or substantially continuously receiving voice commands from a user. In some aspects, the telecommunications device may continuously receive and process voice command while operating in a driving mode, which may be initiated by the telecommunications device.

    Abstract translation: 本文公开了用于通过电信设备接收通过统一音频接口的音频输入的方法,系统和物品。 电信设备还被配置为在从用户连续地或基本上连续地接收语音命令的同时执行听写动作,输入消息处理动作,导航动作,内容查找动作或联系人查找动作中的至少一个。 在一些方面,电信设备可以在可以由电信设备启动的驱动模式下操作时连续地接收和处理语音命令。

Patent Agency Ranking