TECHNIQUES FOR EMPIRICAL MODE DECOMPOSITION (EMD)-BASED SIGNAL DE-NOISING USING STATISTICAL PROPERTIES OF INTRINSIC MODE FUNCTIONS (IMFS)
    2.
    发明申请
    TECHNIQUES FOR EMPIRICAL MODE DECOMPOSITION (EMD)-BASED SIGNAL DE-NOISING USING STATISTICAL PROPERTIES OF INTRINSIC MODE FUNCTIONS (IMFS) 审中-公开
    利用本征模函数(IMFS)的统计特性实现经验模式分解(EMD)信号去噪的技术

    公开(公告)号:WO2017205382A1

    公开(公告)日:2017-11-30

    申请号:PCT/US2017/034017

    申请日:2017-05-23

    Abstract: Techniques for EMD-based signal de-noising are disclosed that use statistical characteristics of IMFs to identify information-carrying IMFs for the purposes of partially reconstructing the identified relevant IMFs into a de-noised signal. The present disclosure has identified that the statistical characteristics of IMFs with noise tend to follow a generalized Gaussian distribution (GGD) versus only a Gaussian or Laplace distribution. Accordingly, a framework for relevant IMF selection is disclosed that includes, in part, performing a null hypothesis test against a distribution of each IMF derived from the use of a generalized probability density function (PDF). IMFs that contribute more noise than signal may thus be identified through the null hypothesis test. Conversely, the aspects and embodiments disclosed herein enable the determination of which IMFs have a contribution of more signal than noise. Thus, a signal may be partially reconstructed based on the predominately information-carrying IMFs to result in de-noised output signal.

    Abstract translation: 公开了用于基于EMD的信号去噪的技术,其使用IMF的统计特性来识别信息承载的IMF,用于将所识别的相关IMF部分重构为去噪信号。 本公开已经识别出具有噪声的IMF的统计特性倾向于遵循广义高斯分布(GGD)而不是高斯或拉普拉斯分布。 因此,公开了用于相关IMF选择的框架,其部分地包括对由使用广义概率密度函数(PDF)导出的每个IMF的分布执行零假设测试。 因此可以通过零假设检验来识别比信号贡献更多噪声的IMF。 相反,本文公开的方面和实施例使得能够确定哪些IMF具有比噪声更多的信号的贡献。 因此,可以基于主要携带信息的IMF来部分重构信号以导致降噪输出信号。

    SYSTEMS AND METHODS FOR ASSISTING AUTOMATIC SPEECH RECOGNITION
    3.
    发明申请
    SYSTEMS AND METHODS FOR ASSISTING AUTOMATIC SPEECH RECOGNITION 审中-公开
    用于协助自动语音识别的系统和方法

    公开(公告)号:WO2017123814A1

    公开(公告)日:2017-07-20

    申请号:PCT/US2017/013260

    申请日:2017-01-12

    Abstract: Systems and methods for assisting automatic speech recognition (ASR) are provided. An example method includes generating, by a mobile device, a plurality of instantiations of a speech component in a captured audio signal, each instantiation of the plurality of instantiations being in support of a particular hypothesis regarding the speech component. At least two instantiations of the plurality of instantiations are then sent to a remote ASR engine. The remote ASR engine is configured to recognize at least one word based on the at least two of the plurality of instantiations and a user context, according to various embodiments. This recognition can include selecting one of the instantiations of the speech component from the plurality of instantiations. The plurality of instantiations may be generated by noise suppression of the captured audio signal with different degrees of aggressiveness. In some embodiments, the plurality of instantiations is generated by synthesizing the speech component from synthetic speech parameters obtained by a spectral analysis of the captured audio signal.

    Abstract translation: 提供了用于辅助自动语音识别(ASR)的系统和方法。 示例方法包括由移动设备生成捕获的音频信号中的语音分量的多个实例,所述多个实例中的每个实例都支持关于语音分量的特定假设。 然后将多个实例的至少两个实例发送到远程ASR引擎。 根据各种实施例,远程ASR引擎被配置为基于多个实例化和用户上下文中的至少两个识别至少一个词。 该识别可以包括从多个实例中选择语音分量的实例之一。 多个实例化可以通过以不同程度的侵略性对捕获的音频信号进行噪声抑制来生成。 在一些实施例中,通过合成来自通过捕获的音频信号的频谱分析获得的合成语音参数的语音分量来生成多个实例。

    AUDIO SIGNAL PROCESSING
    4.
    发明申请
    AUDIO SIGNAL PROCESSING 审中-公开
    音频信号处理

    公开(公告)号:WO2017065989A1

    公开(公告)日:2017-04-20

    申请号:PCT/US2016/054574

    申请日:2016-09-30

    Abstract: An estimated system gain spectrum of an acoustic system is generated, and updated in real-time to respond to changes in the acoustic system. Peak gains in the estimated system gain spectrum are tracked as the estimated system gain spectrum is updated. Based on the tracking, at least one frequency at which the estimated system gain spectrum is currently exhibiting a peak gain is identified. Based on the identification of the at least one frequency, an audio equalizer is controlled to apply, to a first speech containing signal to be played out via an audio output device of the audio device and/or to a second speech containing signal received via an audio input device of the audio device, an equalization filter to reduce the level of that signal at the identified frequency. The equalization filter is applied continuously throughout intervals of both speech activity and speech inactivity in that signal.

    Abstract translation: 生成声学系统的估计系统增益谱,并且实时更新以响应声学系统中的变化。 随着估计的系统增益谱被更新,跟踪估计的系统增益谱中的峰值增益。 基于跟踪,识别估计的系统增益谱当前表现出峰值增益的至少一个频率。 基于对至少一个频率的识别,控制音频均衡器以将第一语音包含信号应用于经由音频设备的音频输出设备和/或经由第二语音包含信号接收的第二语音输出设备 音频设备的音频输入设备,均衡滤波器,用于在所识别的频率下降低该信号的电平。 均衡滤波器连续应用于该信号中的语音活动和语音不活动的间隔。

    METHOD AND APPARATUS FOR IMPROVING LEARNING
    5.
    发明申请
    METHOD AND APPARATUS FOR IMPROVING LEARNING 审中-公开
    改进学习的方法和装置

    公开(公告)号:WO2017029428A1

    公开(公告)日:2017-02-23

    申请号:PCT/FI2016/050514

    申请日:2016-07-11

    CPC classification number: G10L21/003 G09B19/06 G10L21/0232 H04R3/04 H04R5/04

    Abstract: Apparatus and method for remedying an auditory defect, wherein the following steps are performed in the method: receiving an incoming sound signal as an input signal, the incoming sound signal having at least one channel, adjusting the frequency response of the at least one channel of the input signal by filtering out frequencies outside the frequency range of speech of a specific language, outputting the filtered signal of at least one channel.

    Abstract translation: 用于治疗听觉缺陷的装置和方法,其中在所述方法中执行以下步骤:接收输入声音信号作为输入信号,所述输入声音信号具有至少一个通道,调整所述至少一个通道的频率响应 通过滤出特定语言的语音频率以外的频率的输入信号,输出至少一个信道的滤波信号。

    オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
    6.
    发明申请
    オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム 审中-公开
    音频信号处理设备,音频信号处理方法和音频信号处理程序

    公开(公告)号:WO2016185757A1

    公开(公告)日:2016-11-24

    申请号:PCT/JP2016/056204

    申请日:2016-03-01

    Inventor: 菅野 真音

    CPC classification number: G10K11/175 G10L21/0208 G10L21/0232 G10L2021/02163

    Abstract: 周波数領域変換部(11)は、入力信号を所定のフレーム毎に分割し、第一の周波数分割単位毎の信号X(f,τ)を生成する。ノイズ推定信号生成部(12)は、第一の周波数分割単位よりも広い第二の周波数分割単位毎の信号Y(f,τ)を生成する。ピーク範囲検出部(15)は、信号X(f,τ)のピーク範囲を求める。記憶部(13)は信号Y(f,τ)を記憶する。信号比較部(14)は、記憶部(13)に記憶されている信号Y(f,τ)に基づいて、第二の周波数分割単位毎に代表値を算出し、代表値と信号Y(f,τ)とを第二の周波数分割単位毎に比較する。マスク生成部(16)は、ピーク範囲と、信号比較部(14)による比較結果とに基づいて、第一の周波数分割単位毎に抑圧または強調の度合いを決定するマスクM(f,τ)を生成する。マスク適用部(17)は、信号X(f,τ)にマスクM(f,τ)を乗算する。

    Abstract translation: 在本发明中,频域转换单元(11)将输入的信号划分成每个预定帧的信号,以产生每个第一分频单元的信号X(f,τ)。 噪声估计信号生成单元(12)对于比第一分频单位宽的第二分频单位生成信号Y(f,τ)。 峰值范围检测单元(15)获得信号X(f,τ)的峰值范围。 存储单元(13)存储信号Y(f,τ)。 信号比较单元(14)根据存储在存储单元(13)中的信号Y(f,τ)计算每个第二分频单元的代表值,并将代表值与信号Y( f,τ)。 掩模产生单元(16)根据峰值范围和信号比较单元获得的比较结果生成用于确定每个第一分频单元的增强或抑制程度的掩码M(f,τ) 14)。 掩模应用单元(17)将信号X(f,τ)乘以掩码M(f,τ)。

    MICROPHONE ARRAY SPEECH ENHANCEMENT
    7.
    发明申请
    MICROPHONE ARRAY SPEECH ENHANCEMENT 审中-公开
    麦克风阵列语音增强

    公开(公告)号:WO2016147020A1

    公开(公告)日:2016-09-22

    申请号:PCT/IB2015/000476

    申请日:2015-03-19

    Inventor: SALISHEV, Sergey

    Abstract: Speech received from a microphone array is enhanced. In one example, a noise filtering system receives audio from the plurality of microphones, determines a beamformer output from the received audio, applies a first auto-regressive moving average smoothing filter to the beamformer output, determines noise estimates from the received audio, applies a second auto-regressive moving average smoothing filter to the noise estimates, and combines the first and second smoothing filter outputs to produce a power spectral density output of the received audio with reduced noise.

    Abstract translation: 增强了从麦克风阵列接收到的语音。 在一个示例中,噪声滤波系统从多个麦克风接收音频,从接收的音频确定波束形成器输出,向波束形成器输出应用第一自回归移动平均滤波器,从接收到的音频确定噪声估计, 第二自回归移动平均滤波器到噪声估计,并且组合第一和第二平滑滤波器输出以产生具有降低的噪声的接收音频的功率谱密度输出。

    DELAY ESTIMATION FOR ECHO CANCELLATION USING ULTRASONIC MARKERS
    8.
    发明申请
    DELAY ESTIMATION FOR ECHO CANCELLATION USING ULTRASONIC MARKERS 审中-公开
    使用超声波标记的ECHO取消的延迟估计

    公开(公告)号:WO2016096339A1

    公开(公告)日:2016-06-23

    申请号:PCT/EP2015/077558

    申请日:2015-11-24

    Abstract: A far end signal is received at a device, a marker signal is inserted into the far end signal and the far end signal with the marker signal is played on a speaker. A near end signal is received via a microphone and the marker signal is detected in said received near end signal. The detected marker signal is used to determine a delay that is then used to cancel at least some of an echo in the near end signal. The marker may be ultrasonic. The echo canceller and other processing may run at a lower sampling frequency than the marker detection.

    Abstract translation: 在设备处接收远端信号,将标记信号插入远端信号,并且在扬声器上播放具有标记信号的远端信号。 通过麦克风接收近端信号,并在所接收的近端信号中检测标记信号。 检测到的标记信号用于确定随后用于消除近端信号中的至少一些回波的延迟。 标记可以是超声波。 回波消除器和其他处理可以以比标记检测更低的采样频率运行。

    第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム
    9.
    发明申请
    第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム 审中-公开
    第一记录装置,第二记录装置,记录系统,第一记录方法,第二记录方法,第一记录程序和第二记录程序

    公开(公告)号:WO2016063651A1

    公开(公告)日:2016-04-28

    申请号:PCT/JP2015/075855

    申请日:2015-09-11

    Inventor: 清重 龍一

    Abstract:  第1の周波数解析部は、第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、第1の周波数解析の結果を示す第1の結果情報を複数の解析範囲毎に生成する。条件決定部は、第1の音声データにおける第1の音声品質を考慮して解析範囲を決定する。雑音帯域検出部は、第1の結果情報と第2の結果情報とに基づいて、雑音帯域を複数の解析範囲毎に検出する。第1のフィルタ処理部は、雑音帯域のデータをフィルタリングする第1のフィルタを複数の解析範囲毎に生成し、第1のフィルタによる第1のフィルタ処理を第1の音声データに複数の解析範囲毎に施し、第3の音声データを生成する。

    Abstract translation: 在本发明中,第一频率分析部针对多个分析范围的各范围对第一音频数据进行第一频率分析,生成表示多个分析的各范围的第一频率分析结果的第一结果信息 范围。 条件确定单元考虑第一音频数据的第一音频质量来确定分析范围。 噪声频带检测单元基于第一结果信息和第二结果信息来检测多个分析范围的每个范围的噪声频带。 第一滤波处理单元生成对多个分析范围的各范围对噪声频带的数据进行滤波的第一滤波器,对多个分析范围的各范围的第一音频数据对第一音频数据进行第一滤波处理, 生成第三个音频数据。

Patent Agency Ranking