METHOD AND SYSTEM FOR IDENTIFICATION OF SPEECH SEGMENTS
    1.
    发明申请
    METHOD AND SYSTEM FOR IDENTIFICATION OF SPEECH SEGMENTS 审中-公开
    用于识别语音部分的方法和系统

    公开(公告)号:WO2012176199A1

    公开(公告)日:2012-12-27

    申请号:PCT/IL2012/000254

    申请日:2012-06-21

    CPC classification number: G10L15/187 G10L15/24 G10L25/78 G10L25/90

    Abstract: A system for distinguishing and identifying speech segments originating from speech of one or more relevant speakers in a predefined detection area. The system includes an optical system which outputs optical patterns, each representing audio signals as detected by the optical system in the area within a specific time frame; and a computer processor which receives each of the outputted optical patterns and analyses each respective optical pattern to provide information that enables identification of speech segments thereby, by identifying blank spaces in the optical pattern, which define beginning or ending of each respective speech segment.

    Abstract translation: 一种用于区分和识别源自预定义检测区域中的一个或多个相关扬声器的语音的语音片段的系统。 该系统包括:光学系统,其输出光学图案,每个光学图案表示在特定时间范围内由该光学系统在该区域中检测的音频信号; 以及计算机处理器,其接收每个输出的光学图案并且分析每个相应的光学图案以提供能够通过识别限定每个相应语音段的开始或结束的光学图案中的空白空间从而能够识别语音段的信息。

    信号処理方法、信号処理装置、再生装置およびプログラム
    3.
    发明申请
    信号処理方法、信号処理装置、再生装置およびプログラム 审中-公开
    信号处理方法,信号处理装置,生成装置和程序

    公开(公告)号:WO2012111043A1

    公开(公告)日:2012-08-23

    申请号:PCT/JP2011/000921

    申请日:2011-02-18

    Inventor: 大竹 将知

    Abstract:  ダンスミュージックなどの楽曲に対し、ビート感を損ねることなく、低音を強調することを課題とする。本発明の音声信号処理部15は、原音中の、基音に対する倍音信号を抽出する倍音抽出ブロック31と、原音中の、所定の周波数以下の信号のエンベロープである低音エンベロープを生成する低音エンベロープ生成ブロック32と、低音エンベロープのレベルに応じて倍音信号をレベル調整させるレベル調整ブロック33と、レベル調整ブロック33によるレベル調整後の倍音信号と、原音を加算する加算ブロック34と、を備えたことを特徴とする。

    Abstract translation: 本发明的目的是强调低音而不损害诸如舞蹈音乐的音乐中的节奏。 本发明的音频信号处理单元(15)的特征在于具有:用于从原始声音中从基本音调提取谐波信号的谐波声音提取块(31); 用于产生低音包络的低音包络线生成块(32),该低音包络线是在原始声音中具有等于或低于预定频率的频率的信号的包络线; 用于根据低音包络的电平来调节谐波信号的电平的电平调节块(33); 以及用于通过电平调整块(33)调整其电平之后的原始声音和谐波信号的相加块(34)。

    混合音信号中の混合比率推定方法及びシステム並びに音素認識方法
    4.
    发明申请
    混合音信号中の混合比率推定方法及びシステム並びに音素認識方法 审中-公开
    用于估计混合声信号中混合比的方法和系统,以及语音识别方法

    公开(公告)号:WO2011010647A1

    公开(公告)日:2011-01-27

    申请号:PCT/JP2010/062205

    申请日:2010-07-21

    CPC classification number: G10L15/20 G10L21/0208 G10L2015/025

    Abstract:  混合音信号中の対象音信号とノイズ信号との混合比率を推定することができる混合音信号の混合比率推定方法及びシステムを提供する。確率的スペクトルテンプレートを構成する対象音スペクトルテンプレートのゲインとノイズ・スペクトルテンプレートのゲインを変えて得た複数のゲイン変更スペクトルテンプレートと観測スペクトルとの距離が一番小さくなるゲイン変更スペクトルテンプレートを最小距離ゲイン変更スペクトルテンプレートとして決定する。最小距離ゲイン変更スペクトルテンプレートのゲインとノイズ・スペクトルテンプレートのゲインに基づいて混合比率を推定する。

    Abstract translation: 提供了混合声音信号混合比估计方法和系统,用于估计混合声音信号中的目标声音信号和噪声信号之间的混合比率。 构成概率谱模板的目标声谱模板的增益和噪声谱模板的增益被修改以获得多个增益修改的频谱模板。 与观测光谱呈现最短距离的增益修正光谱模板之一被确定为最短距离增益修正光谱模板。 基于最短距离增益修正频谱模板的增益和噪声谱模板的增益来估计混合比。

    APPARATUS AND METHOD FOR DETERMINING A PLURALITY OF LOCAL CENTER OF GRAVITY FREQUENCIES OF A SPECTRUM OF AN AUDIO SIGNAL
    5.
    发明申请
    APPARATUS AND METHOD FOR DETERMINING A PLURALITY OF LOCAL CENTER OF GRAVITY FREQUENCIES OF A SPECTRUM OF AN AUDIO SIGNAL 审中-公开
    用于确定音频信号频谱的重要频率的本地中心的多样性的装置和方法

    公开(公告)号:WO2010112348A1

    公开(公告)日:2010-10-07

    申请号:PCT/EP2010/053574

    申请日:2010-03-18

    CPC classification number: G10L25/90 G10L19/02 G10L19/0204 G10L25/18 G10L25/48

    Abstract: An apparatus for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal comprises an offset determiner, a frequency determiner and an iteration controller. The offset determiner determines an offset frequency for each iteration start frequency of a plurality of iteration start frequencies based on the spectrum of the audio signal, wherein a number of discrete sample values of the spectrum is larger than a number of iteration start frequencies. The frequency determiner determines a new plurality of iteration start frequencies by increasing or reducing each iteration start frequency of the plurality of iteration start frequencies by the corresponding determined offset frequency. The iteration controller provides the new plurality of iteration start frequencies to the offset determiner for further iteration or provides the plurality of local center of gravity frequencies, if a predefined termination condition is fulfilled. The plurality of local center of gravity frequencies can be utilized as a basis for generating a new plurality of iteration start frequencies.

    Abstract translation: 用于确定音频信号的频谱的多个局部重心频率的装置包括偏移确定器,频率确定器和迭代控制器。 偏移确定器基于音频信号的频谱确定多个迭代开始频率的每个迭代开始频率的偏移频率,其中频谱的离散采样值的数量大于迭代开始频率的数量。 频率确定器通过增加或减少多个迭代起始频率的每个迭代开始频率相应的确定的偏移频率来确定新的多个迭代开始频率。 如果满足预定的终止条件,则迭代控制器向偏移确定器提供新的多个迭代开始频率用于进一步迭代,或者提供多个局部重心频率。 多个局部重心频率可以用作生成新的多个迭代开始频率的基础。

    音楽検索装置
    6.
    发明申请
    音楽検索装置 审中-公开
    音乐检索设备

    公开(公告)号:WO2010097870A1

    公开(公告)日:2010-09-02

    申请号:PCT/JP2009/006112

    申请日:2009-11-16

    Inventor: 阿部芳春

    Abstract:  入力歌唱及び検索対象曲の旋律を表現するピッチ周波数系列を推定し、当該ピッチ周波数系列から所定の時間窓で切り出した系列毎に当該系列が取り得るピッチ曲線の形状を表す関数で得られる関数値との内積演算により、旋律の特徴量を求め、求めた特徴量のベクトルからなる特徴ベクトル時系列で入力歌唱と検索対象曲との旋律を照合し、この照合結果に基づいて検索対象曲から所望の楽曲を検索する。

    Abstract translation: 估计表示输入歌曲的旋律的音调频率序列和要检索的一段音乐,通过从音调频率序列计算由预定时间窗口切出的每个序列的内积,可以发现旋律的特征量 以及通过表示序列可以采用的音调曲线的形状的函数获得的函数值,使用从所发现的特征的矢量产生的特征向量时间序列来比较输入的歌曲的旋律和要检索的音乐片段 根据比较结果,从要检索的音乐片段中检索出所需的音乐片段。

    音声分析装置および音声分析方法
    7.
    发明申请
    音声分析装置および音声分析方法 审中-公开
    语音分析设备和语音分析方法

    公开(公告)号:WO2010035438A1

    公开(公告)日:2010-04-01

    申请号:PCT/JP2009/004673

    申请日:2009-09-17

    CPC classification number: G10L19/06 G10L25/12 G10L25/90

    Abstract:  音声分析装置は、音声生成モデルに基づいて入力音声を声道特徴と音源特徴とに分離する声道音源分離部(101)と、分離された音源特徴から、音源特徴における入力音声の基本周波数の時間的な安定度を算出する基本周波数安定度算出部(103)と、安定度に基づいて、安定区間の時間情報を抽出する安定分析区間抽出部(104)と、抽出された安定区間に含まれる声道特徴を用いて、安定区間に含まれない声道特徴を補間する声道特徴補間処理部(105)とを備える。

    Abstract translation: 语音分析装置包括声道/声源分离单元,其将基于语音产生模型的输入语音分离成声道特征和声源特征; 根据分离的声源特性,计算声源特性中的输入语音的基频的时间稳定性的基频稳定度计算部(103) 稳定分析部分提取单元(104),其基于稳定性提取稳定部分的时间信息; 以及使用包括在所提取的稳定部分中的声道特征来插值未包括在稳定部分中的声道特征的声道特征内插单元(105)。

    楽曲練習支援装置
    8.
    发明申请
    楽曲練習支援装置 审中-公开
    宋实践支持设备

    公开(公告)号:WO2008004641A1

    公开(公告)日:2008-01-10

    申请号:PCT/JP2007/063512

    申请日:2007-06-29

    Inventor: 野口 あかね

    Abstract: 歌唱者が自身の歌唱をどのように修正すればよいかを聴覚的に認識することのできる技術を提供する。カラオケ装置1のCPU11は、模範音声データ記憶領域14cに記憶された模範音声データと、入力された練習者音声データとを時間軸方向に対応付ける。次いで、CPU11は、対応付け結果に応じて、練習者音声データのピッチを、当該ピッチに対応する模範音声データのピッチに一致させるようにシフトするとともに、練習者音声データの区間(音節)の区間長を、当該区間に対応する模範音声データの区間の区間長に一致させるように、当該区間を時間軸方向に圧縮又は伸長し、練習者音声データを音声処理部18に出力する。音声処理部18はCPU11から供給される練習者音声データをアナログ信号に変換し、スピーカ19から放音させる。

    Abstract translation: 提供了使歌手能够认真地识别如何改变歌唱方式的技术。 卡拉OK装置(1)的CPU(11)将存储在模型语音数据存储区域(14c)中的模型语音数据与时间轴方向上输入的学习者语音数据相关联。 然后,CPU(11)根据关联结果使学习者语音数据的音调偏移,使其与模型语音数据的相应音调一致,压缩或扩展学习者语音数据的部分(mora) 时间轴方向,使得学习者语音数据的截面长度与模型语音数据的相应部分长度一致,并将所得到的学习者语音数据输出到语音处理部分(18)。 语音处理部(18)将从CPU(11)提供的学习者语音数据变换为模拟信号,并从扬声器(19)生成声音。

    基本周波数推定法および音響信号推定システム
    9.
    发明申请
    基本周波数推定法および音響信号推定システム 审中-公开
    参考频率估计方法和声学信号估计系统

    公开(公告)号:WO2008001779A1

    公开(公告)日:2008-01-03

    申请号:PCT/JP2007/062819

    申请日:2007-06-26

    CPC classification number: G10L25/90

    Abstract: 本開示の基本周波数推定法では、不可分な基本周波数成分からなる合成信号を対象とし、従来、誤差として取り扱われてきたくし形フィルタの微小な出力から信号周期を測定できることに着目し、調波成分の各基本周波数を推定することができる。まず、合成信号の最低基本周波数に対応するくし形フィルタを利用して対象合成信号を処理し、その出力の自己相関関数から信号の周期を測定することで合成信号の各基本周波数を求める。さらに、時間分解能を確保するために、くし形フィルタと自己相関関数を利用することで短時間サンプルに対しても適用でき、サンプル数の不足がない、高精度の周波数分解能で処理が可能である。

    Abstract translation: 参考频率估计方法注意由不可分离的参考频率分量形成的合成信号,并且可以从经过处理为错误的梳状滤波器的微输出测量信号周期。 该方法可以估计要调整的组件的每个参考频率。 首先,通过使用与合成信号的最低参考频率相对应的梳状滤波器来处理对象合成信号,并且使用输出的自相关函数来测量信号的周期,从而获得信号的每个参考 合成信号。 此外,为了确保时间分辨率,通过使用梳状滤波器和自相关函数,该方法也可以应用于短时间采样。 因此,可以以高精度的频率分辨率进行处理,而不会导致样本数量不足。

    METHOD AND APPARATUS FOR CODING AN INFORMATION SIGNAL USING PITCH DELAY CONTOUR ADJUSTMENT
    10.
    发明申请
    METHOD AND APPARATUS FOR CODING AN INFORMATION SIGNAL USING PITCH DELAY CONTOUR ADJUSTMENT 审中-公开
    用于使用倾斜延迟调整来编码信息信号的方法和装置

    公开(公告)号:WO2007018815A2

    公开(公告)日:2007-02-15

    申请号:PCT/US2006/025273

    申请日:2006-06-29

    CPC classification number: G10L19/09 G10L21/00 G10L21/06

    Abstract: In a speech encoder/decoder (200/300) a pitch delay contour endpoint modifier (208) is employed to shift the endpoints of a pitch delay interpolation curve up or down. Particularly, the endpoints of the pitch delay interpolation curve are shifted based on a variation and/or a standard deviation in pitch delay.

    Abstract translation: 在语音编码器/解码器(200/300)中,使用音调延迟轮廓端点修改器(208)来向上或向下移动音调延迟内插曲线的端点。 特别地,音调延迟插值曲线的端点基于音调延迟的变化和/或标准偏差而移位。

Patent Agency Ranking