CONFIRMATION METHOD THROUGH SPEECH SYNTHESIS IN AUTOMATIC DICTATION SYSTEMS AND A SYSTEM FOR THE APPLICATION OF THIS METHOD
    61.
    发明申请
    CONFIRMATION METHOD THROUGH SPEECH SYNTHESIS IN AUTOMATIC DICTATION SYSTEMS AND A SYSTEM FOR THE APPLICATION OF THIS METHOD 审中-公开
    通过自动分类系统中语音合成的确认方法和本方法的应用系统

    公开(公告)号:WO2012011885A1

    公开(公告)日:2012-01-26

    申请号:PCT/TR2011/000175

    申请日:2011-07-22

    CPC classification number: G10L15/22 G10L13/00 G10L2015/221

    Abstract: The invention relates to a method for creating a confirmation mechanism in automatic dictation systems by using speech synthesis (Text-to-Speech-TTS) and feature of segmentation in addition to speech recognition (SR) (Speech Recognition - SR). The invention relates to a system equipped with at least one speech recognition (SR) module (23) converting the words of the users (21) to text by automatically recognising them, a microphone (22) providing input to this module, at least one monitor (24) on which the text can be displayed and edited, belonging to at least one device wherein the dictation system operates, at least one speech synthesis (TTS) module converting the text created as a result of automatic speech recognition to audio output (25), a segmentation module (27) dividing the output created through the speech synthesis into its parts when necessary and a headphone (26) transmitting these outputs to the user (21).

    Abstract translation: 本发明涉及一种通过语音合成(Text-to-Speech-TTS)和语音识别(SR)(Speech Recognition-SR)以外的分割特征在自动听写系统中创建确认机制的方法。 本发明涉及一种配备有至少一个语音识别(SR)模块(23)的系统,该模块(23)通过自动识别用户(21)将文字转换为文本,向该模块提供输入的麦克风(22),至少一个 属于至少一个装置,其中听写系统操作的至少一个语音合成(TTS)模块,其将作为自动语音识别的结果创建的文本转换成音频输出(TTS)模块, 25),在必要时将通过语音合成产生的输出划分成其部分的分割模块(27)和向用户(21)发送这些输出的耳机(26)。

    音声認識装置、音声認識方法、及びプログラム
    63.
    发明申请
    音声認識装置、音声認識方法、及びプログラム 审中-公开
    语音识别装置,语音识别方法和程序

    公开(公告)号:WO2005122144A1

    公开(公告)日:2005-12-22

    申请号:PCT/JP2005/010183

    申请日:2005-06-02

    CPC classification number: G10L15/22 G10L2015/0631 G10L2015/221

    Abstract:  利用者の発話単語が音声認識辞書にとって未登録語であるのか否か、また、認識誤りのため再発話するべきであるのか否かを、利用者に判り易く提示することができる音声認識装置は、音声認識のための語彙を定義し、登録語として記憶する音声認識語彙格納部102と、発話された音声と登録語とを照合する音声認識部101と、音声認識部101の照合結果に基づいて、発話された音声が、登録語であるか未登録語であるかを判定する未登録語判定部104と、未登録語を記憶する未登録語単語格納部106と、未登録語判定部104で未登録語と判定された場合に、発話された音声に対応すると思われる未登録語候補を、未登録語単語格納部106の中から検索する未登録語候補検索部105と、検索結果を表示する結果表示部107とを備える。                      

    Abstract translation: 语音识别装置可以向用户显示用户发音的单词是否是用于语音识别词典的未注册的单词,以及该单词是否应由于错误的识别被重新发音。 语音识别装置包括:语音识别词汇存储单元,用于定义用于语音识别的词汇并将其作为注册词存储; 语音识别单元,用于将发音的语音与注册的单词进行相关; 根据语音识别单元(101)的相关性,判断发音的发音是注册字还是未注册字的未注册字判断单元(104)。 用于存储未注册字的未注册字存储单元(106); 当未注册词判断单元(104)将语音判断为未注册字时用于从未注册的字搜索被认为与发音的语音相对应的未注册词候选的未登记词候选搜索单元(105) 存储单元(106); 以及用于显示搜索结果的结果显示单元(107)。

    SYSTEM FOR CORRECTION OF SPEECH RECOGNITION RESULTS WITH CONFIDENCE LEVEL INDICATION
    64.
    发明申请
    SYSTEM FOR CORRECTION OF SPEECH RECOGNITION RESULTS WITH CONFIDENCE LEVEL INDICATION 审中-公开
    用信心水平指示校正语音识别结果的系统

    公开(公告)号:WO2004088635A1

    公开(公告)日:2004-10-14

    申请号:PCT/IB2004/050360

    申请日:2004-03-30

    CPC classification number: G10L15/26 G10L15/22 G10L2015/221

    Abstract: A correction device (12) for correcting text passages in a recognized text information (RTI) which recognized text information (RTI) is recognized by a speech recognition device from a speech information and which is therefore associated to the speech information comprises a reception unit for receiving the speech information and the associated recognized text information (RTI) and a link information, which link information at each text passage of the associated recognized text information (RTI) marks the part of the speech information at which the text passage was recognized by the speech recognition device, and a confidence level information (CLI), which confidence level information (CLI) at each text passage of the recognized text information (RTI) represents a correctness of the recognition of said text passage and comprises a synchronous playback unit for performing a synchronous playback mode, in which synchronous playback mode during an acoustic playback of the speech information the text passage of the recognized text information (RTI) associated to the speech information just played back and marked by the link information is marked synchronously and comprises an indication unit for indicating the confidence level information (CLI) of a text passage of the text information during the synchronous playback.

    Abstract translation: 用于校正识别的文本信息(RTI)中的识别文本信息(RTI)中的文本段落的校正装置(12)由语音识别装置从语音信息识别,并且因此与语音信息相关联,包括:接收单元, 接收所述语音信息和所述相关联的识别文本信息(RTI)以及链接信息,所述链接信息在相关联的识别文本信息(RTI)的每个文本段落处的链接信息标记所述文本段落被所述文本段落识别的所述语音信息的所述部分 语音识别装置和置信水平信息(CLI),识别的文本信息(RTI)的每个文本通路处的置信水平信息(CLI)表示所述文本通道的识别的正确性,并且包括用于执行的同步回放单元 同步播放模式,其中在语音信息的声音回放期间的同步播放模式 与刚被播放并由链接信息标记的语音信息相关联的识别文本信息(RTI)的文本通道被同步地标记,并且包括用于指示文本的文本通过的置信水平信息(CLI)的指示单元 同步播放期间的信息。

    METHOD AND APPARATUS FOR DISPLAYING SPEECH RECOGNITION RESULTS
    65.
    发明申请
    METHOD AND APPARATUS FOR DISPLAYING SPEECH RECOGNITION RESULTS 审中-公开
    用于显示语音识别结果的方法和装置

    公开(公告)号:WO2004061750A2

    公开(公告)日:2004-07-22

    申请号:PCT/US2003/037241

    申请日:2003-11-18

    Applicant: MOTOROLA INC.

    IPC: G06K

    CPC classification number: G10L15/22 G10L2015/221

    Abstract: The method and apparatus for displaying speech recognition results includes a recognition filter (102) that receives a recognition result list (106) which includes a plurality of speech recognized terms (122), wherein each speech recognized term (122) has a term-specific recognition confidence value (124). The recognition filter (102) generates a modified recognition result list (108) that includes one or more speech recognized terms having term-specific recognition confidence values. The method and apparatus also includes a display generator (104) that receives the modified recognition result list (108) and generates a graphical recognition result list (110). The graphical recognition result list (110) includes speech recognized terms and a non-alphanumeric symbol as a graphical representation (274) of the term-specific recognition confidence value (128) and a speech recognized term (126).

    Abstract translation: 用于显示语音识别结果的方法和装置包括识别滤波器(102),其接收包括多个语音识别术语(122)的识别结果列表(106),其中每个语音识别项(122)具有术语特定 识别置信度值(124)。 识别滤波器(102)产生修改的识别结果列表(108),其包括一个或多个具有术语特定识别置信度值的语音识别术语。 所述方法和装置还包括接收修改的识别结果列表(108)并生成图形识别结果列表(110)的显示生成器(104)。 图形识别结果列表(110)包括语音识别术语和非字母数字符号作为术语特定识别置信度值(128)和语音识别术语(126)的图形表示(274)。

    PATTERN CROSS-MATCHING
    66.
    发明申请
    PATTERN CROSS-MATCHING 审中-公开
    图案交叉匹配

    公开(公告)号:WO2003003347A1

    公开(公告)日:2003-01-09

    申请号:PCT/GB2002/003013

    申请日:2002-06-28

    CPC classification number: G10L15/193 G10L15/22 G10L15/26 G10L2015/221

    Abstract: Disclosed is a data selection mechanism for identifying a single data item from a plurality of data items, each data item having an associated plurality of related descriptors each having an associated descriptor value. The data selection mechanism comprises a pattern matching mechanism for identifying candidate matching descriptor values that correspond to user-generated input, and a filter mechanism for providing a filtered data set comprising the single data item. The pattern matching mechanism is operable to apply one or more pattern recognition models to first user-generated input to generate one or more hypothesised descriptor values for each of the one or more pattern recognition models. The filter mechanism is operable to: i) create a data filter from the hypothesised descriptor values produced by the one or more pattern recognition models to apply to the plurality of data items to produce a filtered data set of candidate data items; and ii) select one or more subsequent pattern recognition models for applying to further user-generated input.

    Abstract translation: 公开了一种用于从多个数据项中识别单个数据项的数据选择机制,每个数据项具有相关联的多个相关描述符,每个具有相关联的描述符值。 数据选择机制包括用于识别与用户生成的输入相对应的候选匹配描述符值的模式匹配机制,以及用于提供包括单个数据项的过滤数据集的过滤机构。 模式匹配机制可操作以将一个或多个模式识别模型应用于第一用户生成的输入,以生成一个或多个模式识别模型中的每个模型识别模型的一个或多个假设描述符值。 过滤器机构可操作以:i)从由一个或多个模式识别模型产生的假设描述符值创建数据过滤器以应用于多个数据项以产生候选数据项的过滤数据集; 以及ii)选择一个或多个随后的模式识别模型以应用于另外的用户生成的输入。

    VERFAHREN ZUM SPRACHGEFÜHRTEN STEUERN VON WERKZEUGMASCHINEN
    67.
    发明申请
    VERFAHREN ZUM SPRACHGEFÜHRTEN STEUERN VON WERKZEUGMASCHINEN 审中-公开
    工具机的语言驱动管理方法

    公开(公告)号:WO2017202401A1

    公开(公告)日:2017-11-30

    申请号:PCT/DE2017/000139

    申请日:2017-05-20

    Inventor: NICKOLAY, Helmut

    CPC classification number: G10L15/22 G10L2015/221 G10L2015/223 G10L2015/225

    Abstract: Die Erfindung betrifft ein Verfahren zum sprachgeführten Steuern von Werkzeugmaschinen (1) durch eine Bedienperson, die Steuerworte artikuliert, wobei die artikulierten Steuerworte von einem Schallwandler (11) erfasst und von einer Sprachverarbeitungseinheit in Steuerbefehle für die Werkzeugmaschine (1) umgewandelt werden, wobei mindestens einem Aggregat der Werkzeugmaschine (1) ein Steuerwort zugeordnet ist und wobei der mindestens eine Aggregat durch Artikulieren des Steuerwortes in Verbindung mit einem Ausführungscode aktiviert wird.

    Abstract translation:

    本发明涉及一种用于sprachgef导航使用艰辛由操作者控制的机器工具(1),阐明了控制字,其特征在于,当检测到来自声换能器(11)的铰接的控制字和一个语音处理单元到的控制命令进行导航用 所述机床(1)被转换,其中所述机床(1)的至少一个单元被分配有控制字,并且其中所述至少一个单元通过将所述控制字与执行码

    智能终端控制方法和智能终端
    68.
    发明申请

    公开(公告)号:WO2017162019A1

    公开(公告)日:2017-09-28

    申请号:PCT/CN2017/075846

    申请日:2017-03-07

    Inventor: 刘国华

    Abstract: 本申请公开了一种智能终端控制方法,包括:接收智能终端上安装的应用程序发出的应用请求;所述应用请求中包含当前登录所述应用程序的用户身份信息;根据所述应用请求采集目标区域范围内用户的人脸图像;根据所述人脸图像识别用户身份信息;判断识别到的用户身份信息是否与所述应用请求中的用户身份信息匹配;若是,则将匹配用户标定为目标用户,并展示所述应用请求,采集目标用户的目标部位的运动轨迹,对运动轨迹进行识别并输出运动轨迹识别结果,根据运动轨迹识别结果对所述应用请求进行相应的应答操作。此外本申请还提供一种智能终端。

    TRANSCRIPTION OF SPOKEN COMMUNICATIONS
    69.
    发明申请
    TRANSCRIPTION OF SPOKEN COMMUNICATIONS 审中-公开
    转交通知书

    公开(公告)号:WO2017048588A1

    公开(公告)日:2017-03-23

    申请号:PCT/US2016/050846

    申请日:2016-09-09

    Abstract: A portion of speech from a near-end user is captured. A near-end user terminal conducts a communication session, over a network, between the near-end user and one or more far- end users, the session including a message sent to the one or more far-end users. A vetting mechanism is provided via a touchscreen user interface of the near-end user terminal, to allow the near-end user to vet an estimated transcription of the portion of speech prior to being sent to the one or more far-end users in the message. According to the vetting mechanism: (i) a first gesture performed by the near-end user through the touchscreen user interface accepts the estimated transcription to be included in a predetermined role in the sent message, whilst (ii) one or more second gestures performed by the near-end user through the touchscreen user interface each reject the estimated transcription to be sent in the message.

    Abstract translation: 捕获来自近端用户的一部分语音。 近端用户终端通过网络在近端用户与一个或多个远端用户之间进行通信会话,该会话包括发送给一个或多个远端用户的消息。 通过近端用户终端的触摸屏用户界面提供审查机制,以允许近端用户在发送到一个或多个远端用户之前,将该部分语音的估计转录审查 信息。 根据审查机制:(i)由近端用户通过触摸屏用户界面执行的第一手势接受所估计的转录以被包括在所发送的消息中的预定角色中,同时(ii)执行一个或多个第二手势 通过触摸屏用户界面的近端用户,每个拒绝在消息中发送的估计转录。

    情報提供システム
    70.
    发明申请
    情報提供システム 审中-公开
    信息提供系统

    公开(公告)号:WO2016147342A1

    公开(公告)日:2016-09-22

    申请号:PCT/JP2015/058073

    申请日:2015-03-18

    Abstract: ディスプレイ(5)の文字表示領域(A1,A2)に表示可能な文字数が規定されている場合、情報提供システムは、提供対象の情報から第一認識対象語を生成すると共に、規定文字数を超える第一認識対象語を当該規定文字数に短縮した文字列すべてを用いて第二認識対象語を生成し、第一認識対象語と第二認識対象語を用いてユーザの発話音声を認識する。

    Abstract translation: 提供一种信息提供系统,当定义显示(5)的文本显示区域(A1,A2)中可以显示的字符数量时,根据要提供的信息生成要识别的第一个字; 生成要识别的第二个字,使用超过定义的字符数的所有要识别的第一个字的字符串减少到定义的字符数; 并识别用户的口语说话,使用要识别的第一个单词和要识别的第二个单词。

Patent Agency Ranking