LASER-BASED SYSTEM AND OPTICAL MICROPHONE HAVING INCREASED BANDWIDTH
    31.
    发明申请
    LASER-BASED SYSTEM AND OPTICAL MICROPHONE HAVING INCREASED BANDWIDTH 审中-公开
    基于激光的系统和具有增加带宽的光学麦克风

    公开(公告)号:WO2017158586A1

    公开(公告)日:2017-09-21

    申请号:PCT/IL2017/050258

    申请日:2017-03-01

    Inventor: BAKISH, Tal

    Abstract: Laser-based system and optical microphone having increased bandwidth. The system includes a laser microphone to transmit a laser beam towards a human speaker; to receive an optical feedback signal reflected back from the human speaker; and to perform self-mixing interferometry. An optical feedback signal bandwidth enhancer improves the bandwidth of the optical feedback signal, to improve the quality of remote speech detection that is based on the optical feedback signal. The bandwidth enhancement utilizes takes into account one or more of: the identity of the face-region hit by the laser beam; the skin color or shade; obstruction of the skin by hair or by accessories; ability to allocate increased processing resources for processing of the optical feedback signal; ability to modify modulation frequency of the optical feedback signal; Signal to Noise Ratio (SNR) estimation; bandwidth estimation; acoustic-optical transmission channel estimation; or other suitable parameters.

    Abstract translation: 基于激光的系统和带宽增加的光学麦克风。 该系统包括激光麦克风,以向人类扬声器发射激光束; 接收从人类说话人反射回来的光学反馈信号; 并执行自混合干涉测量。 光反馈信号带宽增强器改善了光反馈信号的带宽,提高了基于光反馈信号的远端语音检测的质量。 带宽增强利用考虑以下一项或多项:激光束击中的脸部区域的身份; 肤色或阴影; 头发或附件阻塞皮肤; 为处理光反馈信号分配增加的处理资源的能力; 修改光学反馈信号的调制频率的能力; 信噪比(SNR)估计; 带宽估计; 声光传输信道估计; 或其他合适的参数。

    AUTOMATIC TUNING OF SPEECH RECOGNITION PARAMETERS
    32.
    发明申请
    AUTOMATIC TUNING OF SPEECH RECOGNITION PARAMETERS 审中-公开
    自动调整语音识别参数

    公开(公告)号:WO2017111634A1

    公开(公告)日:2017-06-29

    申请号:PCT/PL2015/050074

    申请日:2015-12-22

    CPC classification number: G10L15/20 G10L21/00

    Abstract: System and techniques for automatic tuning of speech recognition parameters are described herein. A clean audio segment and a dirty audio segment may be obtained, in an iterative fashion, optimized preprocessing parameters may be obtained by, at an iteration, selecting a set of parameters, preprocessing the clean audio segment with the set of parameters to produce a first result, preprocessing the dirty audio segment with the set of parameters to produce a second result, and scoring a portion of the first result with the a corresponding portion of the second result using clean-diff. When an optimization threshold is reached, exit the iterative process and provide the set of parameters from the last iteration.

    Abstract translation: 这里描述了用于语音识别参数的自动调整的系统和技术。 可以以迭代的方式获得干净的音频片段和脏音频片段,可以通过在迭代中选择一组参数,利用该组参数预处理干净的音频片段以获得最优化的预处理参数,以产生第一 结果,用该组参数预处理脏音频段以产生第二结果,并且使用clean-diff为第二结果的相应部分对第一结果的一部分打分。 当达到最优化阈值时,退出迭代过程并提供上一次迭代的参数集。

    音声認識装置、音声強調装置、音声認識方法、音声強調方法およびナビゲーションシステム
    33.
    发明申请
    音声認識装置、音声強調装置、音声認識方法、音声強調方法およびナビゲーションシステム 审中-公开
    语音识别装置,语音增强装置,语音识别方法,语音增强方法和导航系统

    公开(公告)号:WO2017094121A1

    公开(公告)日:2017-06-08

    申请号:PCT/JP2015/083768

    申请日:2015-12-01

    CPC classification number: G10L15/20 G10L21/0216

    Abstract: 入力された騒音音声データに対して、それぞれ異なる手法の騒音抑圧処理を行う複数の騒音抑圧部(3)と、騒音信号が抑圧された音声データの音声認識を行う音声認識部(4)と、入力された騒音音声データの音響特徴量から、騒音音声データを複数の騒音抑圧部(3)によりそれぞれ騒音抑圧処理を行った場合に得られる音声認識率を予測する予測部と(2)、予測した音声認識率に基づいて、複数の騒音抑圧部から騒音音声データに対して騒音抑圧処理を行う騒音抑圧部(3)を選択する抑圧手法選択部(2)とを備える。

    Abstract translation: 进行上

    输入噪声的音频数据,多个噪声抑制单元的执行噪声抑制的各自不同的方法和(3),所述语音数据中的噪声信号的语音识别被抑制过程 预测语音识别单元(4),输入噪声的语音数据的声学特征,由多个噪声抑制器的噪声的声音数据的进行相应的噪声抑制处理时获得的语音识别率(3) 预测单元(2),基于所预测的语音识别率,用于选择噪声抑制单元(3)相对于所述噪声的声音数据从多个噪声抑制部分的执行噪声抑制处理抑制方法选择单元(2) 配备了。

    音声調整装置
    34.
    发明申请
    音声調整装置 审中-公开
    语音调整装置

    公开(公告)号:WO2016067644A1

    公开(公告)日:2016-05-06

    申请号:PCT/JP2015/055093

    申请日:2015-02-23

    Inventor: 中村 圭介

    CPC classification number: G10L15/20 G10L21/034 G10L25/84

    Abstract:  音声信号の入力ゲインや出力ゲインを使用環境に合わせて適切に調整し、音声認識率を向上させた音声調整装置を提供する。音声調整装置(20)は、音声信号が音声強度閾値よりも小さい無音状態が継続する無音時間または音声信号が音声強度閾値よりも大きい有音状態が継続する有音時間と、予め設定した時間閾値と比較して音声信号を調整する音声調整部(40)とを備える。

    Abstract translation: 提供一种能够通过根据使用环境适当调整语音信号的输入增益和输出增益来提高语音识别率的语音调整装置。 该语音调节装置(20)具有通过将无声周期或声音周期与预定时间阈值进行比较来调节语音信号的语音调整单元(40),无声周期是无声状态的延续,其中强度 的语音信号小于语音强度阈值,声音周期是语音信号的强度大于语音强度阈值的声音状态的延续。

    VERFAHREN ZUR IDENTIFIKATION UND PRÜFUNG VON SPRECHFUNKMELDUNGEN
    35.
    发明申请
    VERFAHREN ZUR IDENTIFIKATION UND PRÜFUNG VON SPRECHFUNKMELDUNGEN 审中-公开
    方法识别和测试无线发送消息

    公开(公告)号:WO2016037204A1

    公开(公告)日:2016-03-17

    申请号:PCT/AT2015/050217

    申请日:2015-09-08

    Applicant: FREQUENTIS AG

    Inventor: KLOPF, Markus

    Abstract: Die Erfindung betrifft ein Verfahren sowie ein Sprechfunksystem zur Identifikation und Prüfung von Sprechfunkmeldungen (M 1 ...M 3 ) sowie zur Zuordnung von Sprechfunkmeldungen (M 1 ...M 3 ) zu Fahrzeugen (F 1 ...F 3 ), wobei jeweils ein Sprecher an einer vorgegebenen Stelle jeder Sprechfunkmeldung (M 1 ...M 3 ) die Kennung (K) angibt. Erfindungsgemäß ist vorgesehen, dass a) eine Anzahl von abgegebenen Sprechfunkmeldungen (M 1 ...M 3 ) aufgezeichnet wird, wobei jeweils die in der Sprechfunkmeldung (M 1 ...M 3 ) enthaltene Kennung (K) mittels Spracherkennung (0) in eine digitale Kennung (K d ) transformiert wird, wobei aus denjenigen Sprechfunkmeldungen (M 1 ...M 3 ), denen jeweils dieselbe digitale Kennung zugewiesen wurde, ein Biometrie-Datensatz (B 1 ...B 3 ) extrahiert wird, und wobei dieser Biometrie-Datensatz (B 1 ...B 3 ) der jeweiligen digitalen Kennung (K d ) zugewiesen wird, und b) danach eine weitere Sprechfunkmeldung (M 4 ) aufgezeichnet wird, wobei aus der weiteren Sprechfunkmeldung (M 4 ), ein weiterer Biometrie-Datensatz (B 4 ) extrahiert wird, wobei unter den abgespeicherten Biometrie-Datensätzen (B 1 ...B 3 )) nach demjenigen Biometrie-Datensatz (B 1 ) gesucht wird, der mit dem weiteren Biometrie-Datensatz (B 4 ) am besten übereinstimmt und die Sprechfunkmeldung (M 4 ) demjenigen Fahrzeug (F 1 ) mit der diesem Biometrie-Datensatz (B 1 ) zugeordneten Kennung (K d ) zugeordnet wird.

    Abstract translation: 本发明涉及一种在预定的方法和用于识别和无线电消息(M1 ... M3)的测试的无线电系统,以及无线电消息(M1 ... M3)的车辆(F1 ... F3)的分配,其中一个扬声器 指示每个无线消息(M1 ... M3)点,标识符(K)。 根据本发明,它提供了一个)的数释放的无线电消息(M1 ... M3)在每种情况下被记录的标识符(在无线消息M1 ... M3)含有(K)通过语音识别(0)(在数字标识符的装置 Kd)以转化,与那些无线电消息(M1 ... M3),其中在每种情况下相同的数字标识符已经被分配,从提取出的生物特征数据记录(B1 ...... B3),并且其中所述生物统计数据记录(B1 ... 其中(从另外的无线电消息M4)各自的数字标识符(KD)的,另一生物特征数据记录(B4)被提取B3)被分配,和b)随后一个另外的无线电消息(M4)被记录下来,其中,所述存储的生物测定中 数据集(B1 ...... B3))到所搜索的生物特征数据记录(B1)的,其中(与另外的生物统计数据B4)最佳匹配和无线消息(M4),所述车辆(F1)与该生物特征 数据(B1)列车 eordneten标识符(KD)被分配。

    SYSTEM AND METHOD TO LOCALIZE SOUND AND PROVIDE REAL-TIME WORLD COORDINATES WITH COMMUNICATION
    36.
    发明申请
    SYSTEM AND METHOD TO LOCALIZE SOUND AND PROVIDE REAL-TIME WORLD COORDINATES WITH COMMUNICATION 审中-公开
    将声音本地化并提供实时世界协调的系统和方法与通信

    公开(公告)号:WO2015157426A3

    公开(公告)日:2015-12-10

    申请号:PCT/US2015024934

    申请日:2015-04-08

    Applicant: BEATY JOHN

    Abstract: A system, method and program product for improved techniques for sound management and sound localization is provided. The present invention provides for improving sound localization and detection by inputting a predetermined location's dimensional data and location reference and processing detected sound details, detection device details and the associated location dimensional data as sound localization information for multi-dimensional display. The present invention provides mapping information of sound, people and structural information for use in multiple applications including residential, commercial and emergency situations.

    Abstract translation: 提供了用于声音管理和声音定位的改进技术的系统,方法和程序产品。 本发明通过输入预定位置的尺寸数据和位置参考并且将检测到的声音细节,检测装置细节和相关联的位置尺寸数据作为多维显示的​​声音定位信息来提高声音定位和检测。 本发明提供用于包括住宅,商业和紧急情况在内的多种应用的声音,人物和结构信息的映射信息。

    音声認識処理装置、音声認識処理方法、および表示装置
    37.
    发明申请
    音声認識処理装置、音声認識処理方法、および表示装置 审中-公开
    语音识别处理装置,语音识别处理方法和显示装置

    公开(公告)号:WO2015098109A1

    公开(公告)日:2015-07-02

    申请号:PCT/JP2014/006449

    申请日:2014-12-25

    Abstract:  音声操作の操作性を向上する。そのために、音声認識処理装置(100)において、音声取得部(101)は、ユーザが発する音声を取得して音声情報を出力するように構成されている。音声認識部(102)は、音声情報を第1情報に変換するように構成されている。記憶部(170)は、排他語彙が登録された辞書をあらかじめ記憶している。認識結果判定部(104)は、第1情報と排他語彙とを比較し、排他語彙に一致する言葉が第1情報に含まれているときは、第1情報を棄却すべき情報と判定し、排他語彙に一致する言葉が第1情報に含まれていないときは、第1情報を実行すべき情報と判定する。

    Abstract translation: 为了提高语音识别处理装置(100)中的语音动作的操作性,语音取得部(101)被构成为获取由用户产生的语音并输出语音信息。 语音识别单元(102)被配置为将语音信息转换为第一信息。 存储单元(170)预先存储注册了排除词典的字典。 识别结果确定单元(104)比较第一信息和排除词典,并且如果第一信息包含与排除词典匹配的单词,则确定第一信息应被丢弃,并且如果第一信息是第一信息,则确定第一信息应该被实现 信息不包含匹配排除词典的单词。

    语音信号处理方法、装置及服务器

    公开(公告)号:WO2015085946A1

    公开(公告)日:2015-06-18

    申请号:PCT/CN2014/093656

    申请日:2014-12-12

    CPC classification number: G10L21/0208 G10L15/20 G10L19/008 G10L25/21 H04M3/56

    Abstract: 提供了一种语音信号处理方法、装置及服务器,属于通信技术领域。所述方法包括:获取多个通道的原始语音信号,该原始语音信号为数字语音信号(101);对每一个通道的原始语音信号进行滤波,得到每一个通道的第一语音信号,该第一语音信号的频率属于预设频率范围(102);对于每一个通道的第一语音信号,获取该第一语音信号中每段子信号的响度(103);根据该第一语音信号中每段子信号的响度以及该多个通道的同一段子信号的响度和,获取该第一语音信号中每段子信号的第一权重(104);按照该多个通道的第一语音信号中每段子信号的第一权重和该多个通道的第一语音信号,得到处理后的语音信号(105)。该语音信号处理方法通过信号的权重对信号进行处理,提高了语音辨识度。

    METHOD AND APPARATUS FOR MITIGATING FALSE ACCEPTS OF TRIGGER PHRASES
    39.
    发明申请
    METHOD AND APPARATUS FOR MITIGATING FALSE ACCEPTS OF TRIGGER PHRASES 审中-公开
    减轻触发器误差接收的方法和装置

    公开(公告)号:WO2015017686A1

    公开(公告)日:2015-02-05

    申请号:PCT/US2014/049212

    申请日:2014-07-31

    CPC classification number: G10L15/063 G10L15/20 G10L15/22 G10L2025/783

    Abstract: An electronic device includes a microphone (108) that receives an audio signal, and a processor that is electrically coupled to the microphone (108). The processor (204, 300) detects a trigger phrase in the received audio signal and measure characteristics of the detected trigger phrase. Based on the measured characteristics of the detected trigger phrase, the processor (204,300) determines whether the detected trigger phrase is valid.

    Abstract translation: 电子设备包括接收音频信号的麦克风(108)和电耦合到麦克风(108)的处理器。 处理器(204,300)检测接收到的音频信号中的触发短语并测量检测到的触发短语的特征。 基于检测到的触发短语的测量特性,处理器(204,300)确定检测到的触发短语是否有效。

    METHOD AND APPARATUS FOR PRE-PROCESSING AUDIO SIGNALS
    40.
    发明申请
    METHOD AND APPARATUS FOR PRE-PROCESSING AUDIO SIGNALS 审中-公开
    用于预处理音频信号的方法和装置

    公开(公告)号:WO2014143491A1

    公开(公告)日:2014-09-18

    申请号:PCT/US2014/016349

    申请日:2014-02-14

    Abstract: The disclosure is directed to pre-processing audio signals. In one implementation, an electronic device (102) receives an audio signal that has audio information, obtains auxiliary information (such as location, velocity, direction, light, proximity of objects, and temperature), and determines, based on the audio information and the auxiliary information, a type of audio environment in which the electronic device (102) is operating. The device (102) selects an audio pre-processing procedure based on the determined audio environment type and pre-processes the audio signal according to the selected pre-processing procedure. The device (102) may then perform speech recognition on the pre-processed audio signal.

    Abstract translation: 本发明涉及预处理音频信号。 在一个实现中,电子设备(102)接收具有音频信息的音频信号,获得辅助信息(诸如位置,速度,方向,光,对象的接近度和温度),并且基于音频信息和 辅助信息,电子设备(102)在其中操作的一种类型的音频环境。 设备(102)基于所确定的音频环境类型来选择音频预处理过程,并根据所选择的预处理过程对音频信号进行预处理。 然后,设备(102)可以对预处理的音频信号执行语音识别。

Patent Agency Ranking