-
公开(公告)号:WO2009022454A1
公开(公告)日:2009-02-19
申请号:PCT/JP2008/002122
申请日:2008-08-06
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
Abstract: 音声分離装置は、入力音声信号から声道情報を抽出するPARCOR算出部(102)と、PARCOR算出部(102)が抽出した声道情報を、第1の時間幅内で平滑化するフィルタ平滑化部(103)と、フィルタ平滑化部(103)にて平滑化された声道情報の逆の周波数振幅応答特性を有するフィルタのフィルタ係数を算出し、算出されたフィルタ係数を有するフィルタを用いて入力音声信号をフィルタリングする逆フィルタ部(104)と、逆フィルタ部(104)にてフィルタリングされた入力音声信号から第1の時間幅よりも短い第2の時間幅に含まれる波形を切り出し、切り出された波形毎に、当該波形から音源情報を算出する音源モデル化部(105)とを備える。
Abstract translation: 语音分离装置包括:PARCOR计算单元,从输入语音信号中提取声音信息; 滤波器平滑单元,其在第一时间段内平滑由PARCOR计算单元提取的声音信息; 反转滤波器单元(104),其计算已经由滤波器平滑单元(103)滤波的声音信息的反向频率振幅响应特性的滤波器的滤波器系数; 以及声源建模单元(105),其从已经被反向滤波器单元(104)滤波的输入语音信号中切出比第一时间带短的第二时间带中包含的波形,并且计算来自 波形。
-
公开(公告)号:WO2011004579A1
公开(公告)日:2011-01-13
申请号:PCT/JP2010/004386
申请日:2010-07-05
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
IPC: G10L21/04
CPC classification number: G10L21/04 , G10L19/0204 , G10L21/003 , G10L2021/0135
Abstract: 境界周波数以下の周波数帯域において、入力音源スペクトルおよび目標音源スペクトルを用いて、基本波を含む高調波の次数ごとに入力音源波形の高調波のレベルと目標音源波形の高調波のレベルとを所定の変換比率で混合することにより得られる、変換後の基本周波数を基本周波数とする高調波のレベルを有する低域の音源スペクトルを算出する低域高調波レベル算出部(202a、202b)および高調波レベル混合部(203)と、境界周波数よりも大きい周波数帯域において、入力音源スペクトルおよび目標音源スペクトルを、所定の変換比率で混合することにより、高域の音源スペクトルを算出する高域スペクトル包絡混合部(204)と、低域の音源スペクトルと高域の音源スペクトルとを、境界周波数において結合することにより、全域の音源スペクトルを生成するスペクトル結合部(205)とを備える。
Abstract translation: 本发明公开了一种具有低频谐波电平计算单元(202a,202b)和谐波电平混合单元(203)的语音提取转换装置,用于计算具有由以下产生的谐波电平的低频带的声源频谱: 对于包括基波的基频和其基频是后一转换的谐波的每个阶数,将输入的声源波形的谐波的电平和目标声源波形的谐波电平按预定的转换比进行混合 使用在等于或低于边界频率的频带中的输入声源频谱和目标声源频谱;高频带频谱包络混合单元(204),用于通过混合输入的声音来计算高频带的声源频谱 源频谱和以预定转换比高于边界频率的频带中的目标声源频谱,以及频谱连接 (205),用于通过连接低频带的声源频谱和边界频率的高频带的声源频谱来产生整个频带的声源频谱。
-
公开(公告)号:WO2010035438A1
公开(公告)日:2010-04-01
申请号:PCT/JP2009/004673
申请日:2009-09-17
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
Abstract: 音声分析装置は、音声生成モデルに基づいて入力音声を声道特徴と音源特徴とに分離する声道音源分離部(101)と、分離された音源特徴から、音源特徴における入力音声の基本周波数の時間的な安定度を算出する基本周波数安定度算出部(103)と、安定度に基づいて、安定区間の時間情報を抽出する安定分析区間抽出部(104)と、抽出された安定区間に含まれる声道特徴を用いて、安定区間に含まれない声道特徴を補間する声道特徴補間処理部(105)とを備える。
Abstract translation: 语音分析装置包括声道/声源分离单元,其将基于语音产生模型的输入语音分离成声道特征和声源特征; 根据分离的声源特性,计算声源特性中的输入语音的基频的时间稳定性的基频稳定度计算部(103) 稳定分析部分提取单元(104),其基于稳定性提取稳定部分的时间信息; 以及使用包括在所提取的稳定部分中的声道特征来插值未包括在稳定部分中的声道特征的声道特征内插单元(105)。
-
4.音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム 审中-公开
Title translation: 语音分析设备,语音分析/综合设备,校正规则信息生成设备,语音分析系统,语音分析方法,校正规则信息生成方法和程序公开(公告)号:WO2010032405A1
公开(公告)日:2010-03-25
申请号:PCT/JP2009/004514
申请日:2009-09-11
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
CPC classification number: G10L21/0208 , G10L19/0204
Abstract: 背景雑音が存在する実用環境において音声の非周期成分を正確に分析する音声分析装置は、背景雑音と音声との混合音を表す入力信号を複数の帯域通過信号に周波数分割する周波数帯域分割部(104)と、前記入力信号の雑音区間と音声区間とを識別する雑音区間識別部(101)と、各帯域通過信号の前記音声区間におけるパワーと前記雑音区間におけるパワーとの比であるSN比を算出するSNR算出部(106a~106c)と、前記音声区間における各帯域通過信号の自己相関関数を算出する相関関数算出部(105a~105c)と、前記算出されたSN比に基づいて補正量を決定する補正量決定部(107a~107c)と、前記決定された補正量と、前記算出された自己相関関数とに基づいて、前記音声に含まれる非周期成分比率を、前記複数の周波数帯域についてそれぞれ算出する非周期成分比率算出部(108a~108c)とを備える。
Abstract translation: 一种用于在背景噪声存在的实际环境中精确地分析语音的非周期分量的语音分析装置包括频率分割单元(104),其将表示混合声音的输入信号(104)表示为混合声音 背景噪声,成多个带通信号; 噪声部分识别单元,其识别输入信号的噪声和语音部分; SNR计算单元(106a-106c),其计算作为各个带通信号的语音部分的功率与其噪声部分中的功率的比率的S / N比; 相关函数计算单元(105a-105c),每个相关函数计算单元计算语音部分中各个带通信号的自相关函数; 校正量决定单元(107a-107c),其基于各自计算的S / N比决定校正量; 和非周期性分量比计算单元(108a-108c),每个非周期性分量比计算单元(108a-108c)基于所确定的校正量和所计算的自相关函数,计算包括在多个 频带。
-
公开(公告)号:WO2008149547A1
公开(公告)日:2008-12-11
申请号:PCT/JP2008/001407
申请日:2008-06-04
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
IPC: G10L13/06
CPC classification number: G10L13/033 , G10L13/04
Abstract: 複数の声質特徴を記憶する声質特徴DB(101)と、各声質特徴について、当該声質特徴に対応する声質をユーザが想起可能な識別子を記憶する話者属性DB(106)と、声質の音響特徴量毎に重みを設定する重み設定部(103)と、各声質特徴について、当該声質特徴を構成する複数の音響特徴量と重み設定部(103)で設定された重みとに基づいて、当該声質特徴の表示座標を算出する尺度構成部(105)と、各声質特徴について、当該声質特徴に対応する識別子を、算出された表示座標に表示する表示部(107)と、座標の入力を受け付ける位置入力部(108)と、複数の声質特徴の一部または全部の各々について、当該声質特徴の表示座標と上記受け付けられた座標との間の距離を算出し、算出された距離の比率に基づいて複数の声質特徴の一部または全部の音響特徴量を混合することにより新たな声質特徴を生成する声質混合部(110)とを備える。
Abstract translation: 语音特征编辑装置包括存储语音特征的语音特征DB(101),用于存储标识符的扬声器属性DB(106),使得用户能够记住与每个语音特征相对应的语音音调,权重确定 用于确定声音的每个声学特征值的权重的部分(103),用于通过使用构成语音特征的声学特征值和所确定的权重来计算每个语音特征的显示坐标的测量构成部分(105) ,用于在所计算的显示坐标处显示与每个声音特征相对应的标识符的显示部分(107),用于接收坐标输入的位置输入部分(108)和用于计算坐标的输入之间的距离的语音混合部分(110) 部分或全部声音特征和接收到的显示坐标的显示坐标,并混合部分的声学特征值 或所有语音特征根据计算出的距离的比例,从而产生新的语音特征。
-
公开(公告)号:WO2008142836A1
公开(公告)日:2008-11-27
申请号:PCT/JP2008/001160
申请日:2008-05-08
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩 , 加藤弓子
CPC classification number: G10L21/00 , G10L13/00 , G10L13/043 , G10L21/003 , G10L2015/025 , G10L2021/0135
Abstract: 入力音声に対応する情報を用いて入力音声の声質を変換する声質変換装置であって、目標となる声質を表す母音の声道情報である目標母音声道情報を母音毎に保持する目標母音声道情報保持部(101)と、入力音声に対応する音素および音素の時間長情報が付与された声道情報である音素境界情報付声道情報を受け、前記音素境界情報付声道情報に含まれる母音の声道情報の時間変化を第1の関数で近似し、当該母音と同じ母音の前記目標母音声道情報保持部(101)に保持されている声道情報の時間変化を第2の関数で近似し、前記第1の関数と前記第2の関数を結合することにより第3の関数を求め、前記第3の関数により変換後の母音の声道情報を生成する母音変換部(103)と、前記母音変換部(103)による変換後の母音の声道情報を用いて、音声を合成する合成部(107)とを備える。
Abstract translation: 一种用于通过使用与所输入的语音相对应的信息来转换输入语音的语调的语音色调转换装置,包括:一个目标元音声道信息保持单元,用于在表示该元音的元音的声道上保持目标元音声道信息; 每个元音的目标语音,用于接收声道信息的元音转换单元(103),其包括与输入的语音相对应的音素的信息以及音素和音素边界信息的时间长度,近似声道的时间变化 包括在包括具有第一功能的音素边界信息的声道信息的声道信息中的信息,近似在具有第二功能的目标元音声道信息保持单元(101)中保持的同一母音上的声道信息的时间变化, 通过组合第一和第二功能的第三功能,并产生声道信息 通过第三功能转换的元音的合成单元,以及通过使用由元音转换单元(103)转换的元音的声道信息来合成语音的合成单元(107)。
-
公开(公告)号:WO2009044525A1
公开(公告)日:2009-04-09
申请号:PCT/JP2008/002706
申请日:2008-09-29
Applicant: パナソニック株式会社 , 加藤弓子 , 釜井孝浩 , 星見昌克
CPC classification number: G10L21/02 , G10L21/0232 , G10L25/87
Abstract: 話者またはユーザが強調や音楽表現を意図した位置に前記の「力み」音声を発生させることで、怒り、興奮や緊張、元気のある話し方による強調や、演歌、ブルースやロック等の音楽表現を付加して豊かな音声表現を実現する音声強調装置は、入力音声波形のうち、当該入力音声波形を発した発話者が音声波形を変化させることを意図する時間区間である強調区間を検出する強調発声区間検出部(12)と、前記入力音声波形のうち、前記強調発声区間検出部(12)により検出された前記強調区間に含まれる音声波形の振幅包絡の変動を増加させる音声強調部(13)とを備える。
Abstract translation: 一种语音强调装置,在扬声器或用户打算强调或音乐表达的位置产生“紧张”声音,从而增加愤怒,兴奋,紧张,强调开朗的话语,以及“enka”歌曲的音乐表现 ,蓝调,摇滚等,以实现丰富的声音表达,设置有强调话音部分检测单元(12),当强调话音部分检测单元(12)产生输入语音波形的扬声器时,检测输入语音波形中的时间段的加重部分 意图使声音波形发生变化; 以及语音强调单元(13),其增加由强调话音部分检测单元(12)检测到的加重部分中包括的输入语音波形中的语音波形的振幅包络的波动。
-
-
-
-
-
-