情報処理装置、情報処理方法、プログラムおよび認識システム

    公开(公告)号:JP2017167188A

    公开(公告)日:2017-09-21

    申请号:JP2016049424

    申请日:2016-03-14

    发明人: 永尾 学

    IPC分类号: G10L15/14 G10L15/193

    摘要: 【課題】発音記号列が与えられたときに、この発音記号列に類似する発音記号列を得る。 【解決手段】情報処理装置は、発音変換部と、HMM変換部と、探索部と、を備える。発音変換部は、発音記号列を隠れマルコフモデルの状態を並べたHMM状態列へ変換する。HMM変換部は、隠れマルコフモデルの状態間の類似度を定める類似度行列を用いて、HMM状態列を、特定の発音に類似する度合いを表すスコアベクトル列に変換する。探索部は、探索ネットワークに含まれる経路のうち、スコアベクトル列に対するスコアが他の経路より良い経路を探索し、探索した経路に対応する発音記号列を出力する。 【選択図】図1

    音声認識装置及び音声認識方法

    公开(公告)号:JPWO2016103358A1

    公开(公告)日:2017-05-25

    申请号:JP2016565721

    申请日:2014-12-24

    IPC分类号: G10L15/06 G10L15/00

    摘要: 音声認識辞書のデータサイズを抑制しつつ、複数の言語が混在する音声を音声認識可能な技術を提供することを目的とする。音声認識辞書5は、複数の地名辞書51A〜51Cと、他言語の音素を対応言語の音素にマッピングした複数の番地辞書52BA〜52BCとを含む。音声認識言語設定部6に設定された言語用音声認識部が対応言語の音素で音声認識を行うための地名辞書を、複数の地名辞書51A〜51Cの中から設定するとともに、当該言語用音声認識部が他言語の音素を対応言語の音素に置換して音声認識を行うための番地辞書を、複数の番地辞書52BA〜52BCの中から設定する。

    名前発音システム及び方法
    3.
    发明专利

    公开(公告)号:JP2017062475A

    公开(公告)日:2017-03-30

    申请号:JP2016196704

    申请日:2016-10-04

    IPC分类号: G10L13/06 G10L13/08

    摘要: 【課題】名前の音標発音を効率的かつ好都合に構成するユーザインタフェースを提供するシステム、方法及び装置を提供する。 【解決手段】名前を受け取り、その名前を名前の音標発音を組み立てるために組み合わせ可能な複数の単音節要素にマッピングし、ユーザ入力を受け取って複数のうちの1つ以上を選択し、複数の単音節要素の選択された1つ以上を組み合わせて名前の音標発音を組み立てることによって音標発音を名前と関連付ける。 【選択図】図4

    生成装置、認識装置、生成方法およびプログラム
    5.
    发明专利
    生成装置、認識装置、生成方法およびプログラム 审中-公开
    生成装置,识别装置,生成方法和程序

    公开(公告)号:JP2016102947A

    公开(公告)日:2016-06-02

    申请号:JP2014242111

    申请日:2014-11-28

    发明人: 永尾 学

    IPC分类号: G06F17/27 G10L15/193

    摘要: 【課題】変更が不要となり、装置間で共有可能となる有限状態トランスデューサを生成する。 【解決手段】生成装置は、受付部と、生成部と、を備える。受付部は、単語の構成要素となるサブワードを単語に変換する第1モデルを受け付ける。生成部は、1以上のサブワードを1以上の単語に変換する遷移を含む第1経路、および、第1経路の始端となる状態を始端とし、サブワードが割り当てられる循環経路と単語を分類するクラスが割り当てられる遷移とを含む第2経路、を含む第1有限状態トランスデューサを、第1モデルに基づいて生成する。 【選択図】図1

    摘要翻译: 要解决的问题:产生能够分配变化并在设备之间共享的有限状态换能器。解决方案:一种生成装置,包括接收单元; 和一代人单位。 接收单元接收将用作单词的构成要素的子词转换为单词的第一模型。 生成单元基于第一模型生成第一有限状态换能器,该第一有限状态换能器包括包括将一个或多个子字转换成一个或多个字的转变的第一路径和设置第二路径的状态的第二路径 成为第一路径的开始结束,并且包括分配子词的循环路径和分配用于分类单词的类的转换。选择图:图1

    音響認識装置、音響認識方法、及び音響認識プログラム
    6.
    发明专利
    音響認識装置、音響認識方法、及び音響認識プログラム 有权
    声音识别装置,声音识别方法和声音识别程序

    公开(公告)号:JP2015049398A

    公开(公告)日:2015-03-16

    申请号:JP2013181521

    申请日:2013-09-02

    摘要: 【課題】多様な一般音を認識することができる音響認識装置、音響認識方法、及び音響認識プログラムを提供する。【解決手段】音響特徴量算出部は音響信号に基づいて音響特徴量を算出し、ラベル変換部は音響特徴量と音の構成単位である音ユニットを示すラベルとの対応を示すラベルデータを参照して、前記音響特徴量に対応するラベルに変換し、音響同定部は少なくとも1個の音ユニットを少なくとも1個の音ユニット群に区切る確率を示す区切りデータを参照して、前記ラベルから形成されるラベル系列が音ユニット群毎に区切られた音ユニット群系列毎の確率を算出し、算出した確率が最も大きい音ユニット群系列を選択し、音響イベント毎の音ユニット群系列を示す音響イベントデータを参照して、前記選択した音ユニット群系列に対応した音響イベントを同定する。【選択図】図1

    摘要翻译: 要解决的问题:提供能够识别各种一般声音的声音识别装置,声音识别方法和声音识别程序。声音特征量计算部分基于声音来计算声音特征量 信号,并且标签转换部分参考表示声音特征质量与表示声音单元的标签作为声音构成单位的标签之间的相关性的标签数据,将其转换成与声音特征量相对应的标签。 声音识别部分,参照表示将至少一个声音单元划分为至少一个声音单元组的概率的划分数据,对由标签形成的标签系统进行划分的声音单位组系统计算概率,选择 计算出的概率最高的声音单元组系统,并且参照表示声音单元组系统每个声音事件的声音事件数据来识别与所选声音单元组系统相对应的声音事件。

    音響処理ユニットインタフェース

    公开(公告)号:JP2015501011A

    公开(公告)日:2015-01-08

    申请号:JP2014547556

    申请日:2012-12-18

    IPC分类号: G10L15/34 G10L15/28

    摘要: 【課題】本発明の実施形態は、音響モデリングのための装置、方法、及びシステムを含む。【解決手段】一実施形態において、音声認識システムが提供される。このシステムは、受信したオーディオ信号を、各フレームベクトルを有する連続フレームに分割するように構成された処理ユニットと、音響処理ユニット(APU)と、処理ユニット及びAPUを接続するデータバスと、を含む。APUは、複数のシノンを記憶するローカルな不揮発性メモリと、メモリに接続されたメモリバッファであって、音響処理ユニットが、メモリに記憶された少なくとも1つのガウス確率分布ベクトルをメモリバッファ内にロードするように構成された、メモリバッファと、メモリバッファ内にロードされたガウス確率分布ベクトルの複数の次元を、処理ユニットから受信されたフレームベクトルの各次元と同時に比較すると共に、対応するスコアを処理ユニットに出力するように構成された、スコアリングユニットと、を含む。処理ユニットが第2のフレームに対応するスコアを用いたサーチ動作を実行する間にAPUが第1のフレームを用いた比較を実行するように構成され、第2のフレームは第1のフレームの直前にある。【選択図】図27

    Pattern identification device, pattern recognition method, program, learning device and learning method
    8.
    发明专利
    Pattern identification device, pattern recognition method, program, learning device and learning method 有权
    图案识别装置,图案识别方法,程序,学习装置和学习方法

    公开(公告)号:JP2014174693A

    公开(公告)日:2014-09-22

    申请号:JP2013045895

    申请日:2013-03-07

    摘要: PROBLEM TO BE SOLVED: To improve identification accuracy.SOLUTION: A pattern identification device includes a reception part, a determination part, an execution part. a calculation part and a decision part. The reception part receives an input pattern and attribute information of the input pattern. The determination part determines a subclass which the input pattern belongs to on the basis of at least the attribute information. The execution part identifies whether the input pattern belongs to a class by using a weak discriminator allocated to the determined subclass and outputs an identification result and a degree of reliability of the weak discriminator. The calculation part calculates an integrated value obtained by integrating an evaluation value based on the identification result and the degree of reliability. The decision part decides whether termination conditions of identification processing by the determination part, the execution part and the calculation part are satisfied and repeats the identification processing when the termination conditions are not satisfied while it ends the identification processing and outputs an integrated value at the time of ending when the termination conditions are satisfied.

    摘要翻译: 要解决的问题:提高识别精度。解决方案:图案识别装置包括接收部分,确定部分,执行部分。 计算部分和决策部分。 接收部分接收输入图案和输入图案的属性信息。 确定部至少基于属性信息确定输入模式所属的子类。 执行部通过使用分配给所确定的子类的弱鉴别器来识别输入模式是否属于类,并输出弱鉴别器的识别结果和可靠性程度。 计算部分计算通过基于识别结果和可靠性程度对评估值进行积分而获得的积分值。 决定部判定在确定部,执行部和计算部满足的识别处理的终止条件,并且当结束识别处理时终止条件不满足时重复进行识别处理,并在此时输出积分值 当满足终止条件时结束。

    Voice recognition device and speech recognition method

    公开(公告)号:JP5282737B2

    公开(公告)日:2013-09-04

    申请号:JP2009529074

    申请日:2008-08-22

    发明人: 健 花沢

    摘要: A distance calculation unit (16) obtains the acoustic distance between the feature amount of input speech and each phonetic model. A word search unit (17) performs a word search based on the acoustic distance and a language model including the phoneme and prosodic label of a word, and outputs a word hypothesis and a first score representing the likelihood of the word hypothesis. The word search unit (17) also outputs a vowel interval and its tone label in the input speech, when assuming that the recognition result of the input speech is the word hypothesis. A tone recognition unit (21) outputs a second score representing the likelihood of the tone label output from the word search unit (17) based on a feature amount corresponding to the vowel interval output from the word search unit (17). A rescore unit (22) corrects the first score of the word hypothesis output from the word search unit (17) using the second score output from the tone recognition unit (21). This allows to raise the speech recognition accuracy for tone speech.

    Word identification method, word identification device, and computer-readable code
    10.
    发明专利
    Word identification method, word identification device, and computer-readable code 有权
    字识别方法,字识别装置和计算机可读代码

    公开(公告)号:JP2013068970A

    公开(公告)日:2013-04-18

    申请号:JP2012273922

    申请日:2012-12-14

    发明人: SAFFEL ZSOLT

    摘要: PROBLEM TO BE SOLVED: To recognize an infinite number of words in principle.SOLUTION: The present invention handles a system for speech recognition, for example, for recognizing words in a continuous speech. Disclosed is a speech recognition system capable of recognizing a great number of words, or an infinite number of words in principle. The speech recognition system includes a word recognition device for deriving the best path in a word graph, and words are allocated to the speech based upon a minimum path thereof. A phoneme language model is applied to respective words of the word graph to obtain a word score. Further, the present invention relates to a device and method which identify words from a speech block, and a computer-readable code for implementing the method.

    摘要翻译: 要解决的问题:原则上承认无限数量的单词。 解决方案:本发明处理用于语音识别的系统,例如用于识别连续语音中的单词。 公开了一种能够在原理上识别大量单词或无限数量的单词的语音识别系统。 语音识别系统包括用于导出单词图形中的最佳路径的单词识别装置,并且基于其最小路径将词语分配给语音。 将音素语言模型应用于单词图形的相应单词以获得单词分数。 此外,本发明涉及一种识别来自语音块的单词的装置和方法,以及用于实现该方法的计算机可读代码。 版权所有(C)2013,JPO&INPIT