-
公开(公告)号:WO2009022454A1
公开(公告)日:2009-02-19
申请号:PCT/JP2008/002122
申请日:2008-08-06
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
Abstract: 音声分離装置は、入力音声信号から声道情報を抽出するPARCOR算出部(102)と、PARCOR算出部(102)が抽出した声道情報を、第1の時間幅内で平滑化するフィルタ平滑化部(103)と、フィルタ平滑化部(103)にて平滑化された声道情報の逆の周波数振幅応答特性を有するフィルタのフィルタ係数を算出し、算出されたフィルタ係数を有するフィルタを用いて入力音声信号をフィルタリングする逆フィルタ部(104)と、逆フィルタ部(104)にてフィルタリングされた入力音声信号から第1の時間幅よりも短い第2の時間幅に含まれる波形を切り出し、切り出された波形毎に、当該波形から音源情報を算出する音源モデル化部(105)とを備える。
Abstract translation: 语音分离装置包括:PARCOR计算单元,从输入语音信号中提取声音信息; 滤波器平滑单元,其在第一时间段内平滑由PARCOR计算单元提取的声音信息; 反转滤波器单元(104),其计算已经由滤波器平滑单元(103)滤波的声音信息的反向频率振幅响应特性的滤波器的滤波器系数; 以及声源建模单元(105),其从已经被反向滤波器单元(104)滤波的输入语音信号中切出比第一时间带短的第二时间带中包含的波形,并且计算来自 波形。
-
公开(公告)号:WO2011004579A1
公开(公告)日:2011-01-13
申请号:PCT/JP2010/004386
申请日:2010-07-05
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
IPC: G10L21/04
CPC classification number: G10L21/04 , G10L19/0204 , G10L21/003 , G10L2021/0135
Abstract: 境界周波数以下の周波数帯域において、入力音源スペクトルおよび目標音源スペクトルを用いて、基本波を含む高調波の次数ごとに入力音源波形の高調波のレベルと目標音源波形の高調波のレベルとを所定の変換比率で混合することにより得られる、変換後の基本周波数を基本周波数とする高調波のレベルを有する低域の音源スペクトルを算出する低域高調波レベル算出部(202a、202b)および高調波レベル混合部(203)と、境界周波数よりも大きい周波数帯域において、入力音源スペクトルおよび目標音源スペクトルを、所定の変換比率で混合することにより、高域の音源スペクトルを算出する高域スペクトル包絡混合部(204)と、低域の音源スペクトルと高域の音源スペクトルとを、境界周波数において結合することにより、全域の音源スペクトルを生成するスペクトル結合部(205)とを備える。
Abstract translation: 本发明公开了一种具有低频谐波电平计算单元(202a,202b)和谐波电平混合单元(203)的语音提取转换装置,用于计算具有由以下产生的谐波电平的低频带的声源频谱: 对于包括基波的基频和其基频是后一转换的谐波的每个阶数,将输入的声源波形的谐波的电平和目标声源波形的谐波电平按预定的转换比进行混合 使用在等于或低于边界频率的频带中的输入声源频谱和目标声源频谱;高频带频谱包络混合单元(204),用于通过混合输入的声音来计算高频带的声源频谱 源频谱和以预定转换比高于边界频率的频带中的目标声源频谱,以及频谱连接 (205),用于通过连接低频带的声源频谱和边界频率的高频带的声源频谱来产生整个频带的声源频谱。
-
公开(公告)号:WO2010035438A1
公开(公告)日:2010-04-01
申请号:PCT/JP2009/004673
申请日:2009-09-17
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
Abstract: 音声分析装置は、音声生成モデルに基づいて入力音声を声道特徴と音源特徴とに分離する声道音源分離部(101)と、分離された音源特徴から、音源特徴における入力音声の基本周波数の時間的な安定度を算出する基本周波数安定度算出部(103)と、安定度に基づいて、安定区間の時間情報を抽出する安定分析区間抽出部(104)と、抽出された安定区間に含まれる声道特徴を用いて、安定区間に含まれない声道特徴を補間する声道特徴補間処理部(105)とを備える。
Abstract translation: 语音分析装置包括声道/声源分离单元,其将基于语音产生模型的输入语音分离成声道特征和声源特征; 根据分离的声源特性,计算声源特性中的输入语音的基频的时间稳定性的基频稳定度计算部(103) 稳定分析部分提取单元(104),其基于稳定性提取稳定部分的时间信息; 以及使用包括在所提取的稳定部分中的声道特征来插值未包括在稳定部分中的声道特征的声道特征内插单元(105)。
-
4.音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム 审中-公开
Title translation: 语音分析设备,语音分析/综合设备,校正规则信息生成设备,语音分析系统,语音分析方法,校正规则信息生成方法和程序公开(公告)号:WO2010032405A1
公开(公告)日:2010-03-25
申请号:PCT/JP2009/004514
申请日:2009-09-11
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
CPC classification number: G10L21/0208 , G10L19/0204
Abstract: 背景雑音が存在する実用環境において音声の非周期成分を正確に分析する音声分析装置は、背景雑音と音声との混合音を表す入力信号を複数の帯域通過信号に周波数分割する周波数帯域分割部(104)と、前記入力信号の雑音区間と音声区間とを識別する雑音区間識別部(101)と、各帯域通過信号の前記音声区間におけるパワーと前記雑音区間におけるパワーとの比であるSN比を算出するSNR算出部(106a~106c)と、前記音声区間における各帯域通過信号の自己相関関数を算出する相関関数算出部(105a~105c)と、前記算出されたSN比に基づいて補正量を決定する補正量決定部(107a~107c)と、前記決定された補正量と、前記算出された自己相関関数とに基づいて、前記音声に含まれる非周期成分比率を、前記複数の周波数帯域についてそれぞれ算出する非周期成分比率算出部(108a~108c)とを備える。
Abstract translation: 一种用于在背景噪声存在的实际环境中精确地分析语音的非周期分量的语音分析装置包括频率分割单元(104),其将表示混合声音的输入信号(104)表示为混合声音 背景噪声,成多个带通信号; 噪声部分识别单元,其识别输入信号的噪声和语音部分; SNR计算单元(106a-106c),其计算作为各个带通信号的语音部分的功率与其噪声部分中的功率的比率的S / N比; 相关函数计算单元(105a-105c),每个相关函数计算单元计算语音部分中各个带通信号的自相关函数; 校正量决定单元(107a-107c),其基于各自计算的S / N比决定校正量; 和非周期性分量比计算单元(108a-108c),每个非周期性分量比计算单元(108a-108c)基于所确定的校正量和所计算的自相关函数,计算包括在多个 频带。
-
公开(公告)号:WO2008149547A1
公开(公告)日:2008-12-11
申请号:PCT/JP2008/001407
申请日:2008-06-04
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩
IPC: G10L13/06
CPC classification number: G10L13/033 , G10L13/04
Abstract: 複数の声質特徴を記憶する声質特徴DB(101)と、各声質特徴について、当該声質特徴に対応する声質をユーザが想起可能な識別子を記憶する話者属性DB(106)と、声質の音響特徴量毎に重みを設定する重み設定部(103)と、各声質特徴について、当該声質特徴を構成する複数の音響特徴量と重み設定部(103)で設定された重みとに基づいて、当該声質特徴の表示座標を算出する尺度構成部(105)と、各声質特徴について、当該声質特徴に対応する識別子を、算出された表示座標に表示する表示部(107)と、座標の入力を受け付ける位置入力部(108)と、複数の声質特徴の一部または全部の各々について、当該声質特徴の表示座標と上記受け付けられた座標との間の距離を算出し、算出された距離の比率に基づいて複数の声質特徴の一部または全部の音響特徴量を混合することにより新たな声質特徴を生成する声質混合部(110)とを備える。
Abstract translation: 语音特征编辑装置包括存储语音特征的语音特征DB(101),用于存储标识符的扬声器属性DB(106),使得用户能够记住与每个语音特征相对应的语音音调,权重确定 用于确定声音的每个声学特征值的权重的部分(103),用于通过使用构成语音特征的声学特征值和所确定的权重来计算每个语音特征的显示坐标的测量构成部分(105) ,用于在所计算的显示坐标处显示与每个声音特征相对应的标识符的显示部分(107),用于接收坐标输入的位置输入部分(108)和用于计算坐标的输入之间的距离的语音混合部分(110) 部分或全部声音特征和接收到的显示坐标的显示坐标,并混合部分的声学特征值 或所有语音特征根据计算出的距离的比例,从而产生新的语音特征。
-
公开(公告)号:WO2008142836A1
公开(公告)日:2008-11-27
申请号:PCT/JP2008/001160
申请日:2008-05-08
Applicant: パナソニック株式会社 , 廣瀬良文 , 釜井孝浩 , 加藤弓子
CPC classification number: G10L21/00 , G10L13/00 , G10L13/043 , G10L21/003 , G10L2015/025 , G10L2021/0135
Abstract: 入力音声に対応する情報を用いて入力音声の声質を変換する声質変換装置であって、目標となる声質を表す母音の声道情報である目標母音声道情報を母音毎に保持する目標母音声道情報保持部(101)と、入力音声に対応する音素および音素の時間長情報が付与された声道情報である音素境界情報付声道情報を受け、前記音素境界情報付声道情報に含まれる母音の声道情報の時間変化を第1の関数で近似し、当該母音と同じ母音の前記目標母音声道情報保持部(101)に保持されている声道情報の時間変化を第2の関数で近似し、前記第1の関数と前記第2の関数を結合することにより第3の関数を求め、前記第3の関数により変換後の母音の声道情報を生成する母音変換部(103)と、前記母音変換部(103)による変換後の母音の声道情報を用いて、音声を合成する合成部(107)とを備える。
Abstract translation: 一种用于通过使用与所输入的语音相对应的信息来转换输入语音的语调的语音色调转换装置,包括:一个目标元音声道信息保持单元,用于在表示该元音的元音的声道上保持目标元音声道信息; 每个元音的目标语音,用于接收声道信息的元音转换单元(103),其包括与输入的语音相对应的音素的信息以及音素和音素边界信息的时间长度,近似声道的时间变化 包括在包括具有第一功能的音素边界信息的声道信息的声道信息中的信息,近似在具有第二功能的目标元音声道信息保持单元(101)中保持的同一母音上的声道信息的时间变化, 通过组合第一和第二功能的第三功能,并产生声道信息 通过第三功能转换的元音的合成单元,以及通过使用由元音转换单元(103)转换的元音的声道信息来合成语音的合成单元(107)。
-
公开(公告)号:WO2009019824A1
公开(公告)日:2009-02-12
申请号:PCT/JP2008/001998
申请日:2008-07-25
Applicant: パナソニック株式会社 , 吾妻健夫 , 登一生 , 本村秀人 , 廣瀬良文
CPC classification number: H04N9/045 , H04N5/35545
Abstract: 各カメラへ入射する光量の低下をなくし、高解像度で、かつ、高フレームレートの動画像を生成可能な画像処理装置および方法を提供する。 撮像処理装置は、可視光を、少なくとも第1および第2色成分に分離する分離部と、第1色成分の動画像を撮影する第1撮像部であって、第1電荷蓄積期間で露光して、動画像の各画像を第1空間解像度で、かつ、第1時間解像度で撮影する第1撮像部と、第2色成分の動画像を撮影する第2撮像部であって、第1電荷蓄積期間よりも長い第2電荷蓄積期間で露光して、動画像の各画像を第1空間解像度よりも高い第2空間解像度で、かつ、第1時間解像度よりも低い第2時間解像度で撮影する第2撮像部と、第1および第2の撮像部における撮像条件を制御する制御部と、第1色成分および第2色成分の各動画像の情報に基づいて、時空間解像度を高めた第2成分の動画像を生成する処理部とを備えている。
Abstract translation: 本发明的目的是提供一种图像处理装置和图像处理方法,其被配置为不降低入射到每个相机上的光量并且以高帧率产生具有高分辨率的动态图像。 图像拾取处理装置包括分离单元,其将可见光分成至少第一和第二颜色分量; 第一图像拾取单元,其拾取第一颜色分量的动态图像并且执行第一电荷累积时段的曝光和以第一空间分辨率和第一时间分辨率拾取每个动态图像, 第二图像拾取单元,其拾取第二颜色分量的动态图像,并且对于比第一电荷累积期间长的第二电荷累积期间进行曝光,并且利用图像拾取单元 第二空间分辨率高于第一空间分辨率并且具有低于第一时间分辨率的第二时间分辨率; 控制单元,其控制第一和第二图像拾取单元的图像拾取条件; 以及处理单元,其基于第一和第二颜色分量的每个动态图像的信息生成其中增强了时间 - 空间分辨率的第二颜色分量的动态图像。
-
-
-
-
-
-