-
公开(公告)号:CN1294555C
公开(公告)日:2007-01-10
申请号:CN200310102866.5
申请日:1995-12-06
Applicant: 松下电器产业株式会社
Abstract: 一种语音段制作方法、语音合成方法及其装置。其特征在于所述语音合成方法对语音波形特定部分中的各基音周期的波峰用一在波峰两端收敛于零附近的窗函数对全部波峰截取音高波形,并对语音波形产生语音段数据,使窗函数长度短于波峰至两端的长度。存储语音段数据,从所存储的语音段数据读出音高波形,叠加排列成所需音高周期间隔,并把这些波形加给输出部分作为一个语音波形。
-
公开(公告)号:CN1842702A
公开(公告)日:2006-10-04
申请号:CN200580000891.X
申请日:2005-09-20
Applicant: 松下电器产业株式会社
CPC classification number: G10L13/033 , G10L13/04
Abstract: 提供可适当变换音质的声音合成装置。该声音合成装置具有:单元存储部(102),存储有多个声音单元;函数存储部(104),存储有多个变换函数;拟和优度判断部(105),比较单元存储部(102)中存储的声音单元、和制作函数存储部(104)中存储的变换函数时使用的声音单元的音响特征,来导出类似度;选择部(103)和音质变换部(106),根据由拟和优度判断部(105)导出的类似度,对单元存储部(104)中存储的每个声音单元,应用函数存储部(104)中存储的某个变换函数,从而变换该声音单元的音质。
-
公开(公告)号:CN1146863C
公开(公告)日:2004-04-21
申请号:CN95119049.0
申请日:1995-12-06
Applicant: 松下电器产业株式会社
IPC: G10L13/02
Abstract: 一种语音段制作方法、语音合成方法及其装置。其特征在于所述语音合成方法对语音波形特定部分中的各基音周期的波峰用一在波峰两端收敛于零附近的窗函数对全部波峰截取音高波形,并对语音波形产生语音段数据,使窗函数长度短于波峰至两端的长度。存储语音段数据,从所存储的语音段数据读出音高波形,叠加排列成所需音高周期间隔,并把这些波形加给输出部分作为一个语音波形。
-
公开(公告)号:CN103370743A
公开(公告)日:2013-10-23
申请号:CN201280007069.6
申请日:2012-07-12
Applicant: 松下电器产业株式会社
CPC classification number: G10L21/003 , G10L13/033 , G10L21/04 , G10L25/15
Abstract: 音质变换系统(100)具备:母音接受部(102),接受种类互不相同的多个母音的语音;分析部(103),分析接受的多个母音的语音,从而按每个母音的种类,生成第一声道形状信息;混合部(105),按每个母音的种类,对该母音的第一声道形状信息和与该母音不同种类的母音的第一声道形状信息进行混合,从而生成该母音的第二声道形状信息;以及合成部(108),通过对输入语音中包含的母音的声道形状信息和与输入语音中包含的母音相同种类的母音的第二声道形状信息进行混合,从而变换输入语音的声道形状信息,通过使用变换后的输入语音的声道形状信息和输入语音的声源信息生成合成音,从而变换输入语音的音质。
-
公开(公告)号:CN101983402B
公开(公告)日:2012-06-27
申请号:CN200980111700.5
申请日:2009-09-11
Applicant: 松下电器产业株式会社
CPC classification number: G10L21/0208 , G10L19/0204
Abstract: 本发明为一种声音分析装置,在存在背景噪声的实际环境下,能够正确地分析声音的非周期成分,并且,包括:频带划分部(104),将表示背景噪声和声音的混合音的输入信号频率划分为多个带通信号;噪声区间识别部(101),识别所述输入信号的噪声区间和声音区间;信噪比计算部(106a-106c),计算出信噪比,该信噪比为各个带通信号的所述声音区间中的功率和所述噪声区间中的功率的比率;相关函数计算部(105a-105c),计算出所述声音区间中的各个带通信号的自相关函数;校正量决定部(107a-107b),根据计算出的所述信噪比,决定校正量;以及非周期成分比率计算部(108a-108c),根据被决定的所述校正量和计算出的所述自相关函数,针对所述多个频带分别计算出所述声音中包含的非周期成分比率。
-
公开(公告)号:CN101981612B
公开(公告)日:2012-06-27
申请号:CN200980111434.6
申请日:2009-09-17
Applicant: 松下电器产业株式会社
Abstract: 本发明为一种声音分析装置,并且,包括:声道声源分离部(101),根据声音生成模型,从输入声音中分离出声道特征和声源特征;基本频率稳定度计算部(103),根据分离出的声源特征,计算出声源特征中的输入声音的基本频率在时间上的稳定度;稳定分析区间提取部(104),根据稳定度,提取稳定区间的时间信息;以及声道特征插值处理部(105),利用包含在提取的稳定区间内的声道特征,来对不包含在稳定区间内的声道特征进行插值。
-
公开(公告)号:CN101622659B
公开(公告)日:2012-02-22
申请号:CN200880001664.2
申请日:2008-06-04
Applicant: 松下电器产业株式会社
IPC: G10L13/06
CPC classification number: G10L13/033 , G10L13/04
Abstract: 本发明的音质编辑装置包括:音质特征DB(101),记忆多个音质特征;讲话者属性DB(106),关于各个音质特征,记忆用户能够想起的与该音质特征对应的音质的标识符;权重设定部(103),按每个音质的声特征量设定权重;尺度构成部(105),关于各个音质特征,根据构成该音质特征的多个声特征量和权重设定部(103)所设定的权重,算出该音质特征的显示坐标;显示部(107),关于各个音质特征,在算出的显示坐标上显示与该音质特征对应的标识符;位置输入部(108),接受坐标的输入;音质混合部(110),关于多个音质特征的一部分或全部的每一个,通过算出该音质特征的显示坐标与所述接受了的坐标之间的距离,并根据算出的距离的比率,混合多个音质特征的一部分或全部的声特征量,生成新的音质特征。
-
公开(公告)号:CN100547654C
公开(公告)日:2009-10-07
申请号:CN200580001970.2
申请日:2005-05-19
Applicant: 松下电器产业株式会社
IPC: G10L13/08
CPC classification number: G10L13/00
Abstract: 提供一种语音合成装置,该语音合成装置可以防止由于朗读对象的文章不完整而引起的用户的混乱和合成音的质量劣化,可提供对用户来说容易理解的语音。包括:不完整部分检测部(103),检测出所输入的电子邮件文本(100)中因字符串的欠缺而在语言上不完整的部分即不完整部分,参考存储有过去所接收的电子邮件文本的邮件箱(107),来补全所检测出的不完整部分中欠缺的字符串;语音合成部(104),根据补全后的电子邮件文本,生成合成音;不完整部分模糊化部(105),使与不完整部分检测部(103)中检测出的不完整部分相对应的合成音的听觉上的清晰度降低和扬声器装置(106),再现输出所生成的合成音。
-
公开(公告)号:CN101176146A
公开(公告)日:2008-05-07
申请号:CN200680016873.5
申请日:2006-05-02
Applicant: 松下电器产业株式会社
IPC: G10L13/08
CPC classification number: G10L13/10 , G10L13/033
Abstract: 本发明所涉及的声音合成装置包括:情感输入部(202),获得被声音合成的声音波形的说话状态;韵律生成部(205),生成韵律,该韵律是以获得的所述说话状态,说出经过语言处理的文本时的韵律;特征性音色选择部(203),根据所述说话状态来选择观察到的特征性音色,且所述特征性音色是以获得的所述说话状态,说出所述文本时观察到的;音色时间位置推定部(604),根据所述文本的音韵串、所述特征性音色、以及所述韵律,以构成所述音韵串的各个音韵为单位,来判断是否以所述特征性音色来说话,并决定音韵,该音韵位于以所述特征性音色来说话的说话位置;单元选择部(606),根据所述音韵串、所述韵律以及所述说话位置,以所述说话状态说出所述文本,且生成声音波形,该声音波形是在所述说话位置决定单元所决定的说话位置,以特征性音色说出所述文本的声音波形;以及单元连接部(209)。
-
公开(公告)号:CN100365704C
公开(公告)日:2008-01-30
申请号:CN200380100452.7
申请日:2003-11-25
Applicant: 松下电器产业株式会社
IPC: G10L13/00
Abstract: 语言处理部(31)分析来自对话处理部(20)的文本,变换为发音以及重音信息;韵律生成部(32)生成对应于来自对话处理部(20)的控制信号的抑扬顿挫模式。波形DB(34)中存储了事先录音的波形数据和对其加入的音调标记的数据;波形分离部(33)从波形DB(34)中分离所期望的音调波形;相位操作部(35)通过将由波形分离部(33)分离的音调波形的相位频谱定型化,除去相位波动,其后根据来自对话处理部(20)的控制信号通过只将高域的相位成分随机扩散加入相位波动。这样得到的音调波形通过波形重叠部(36)以所期望的间隔排列,重叠地配置。
-
-
-
-
-
-
-
-
-