-
公开(公告)号:CN105957515B
公开(公告)日:2019-10-22
申请号:CN201610124952.3
申请日:2016-03-04
申请人: 雅马哈株式会社
IPC分类号: G10L13/033 , G10H1/00 , G10H7/02 , G10L13/02
摘要: 本发明提供了声音合成方法、声音合成装置和存储声音合成程序的介质。一种声音合成方法,用于通过提取自参考声音的语音片段的连接而产生声音信号,所述方法包括:由片段选择单元顺序地选择所述语音片段;由音高设置单元设置音高过渡,在所述音高过渡中,根据与作为所述参考声音的声产生参考的参考音高和所述片段选择单元所选择的语音片段的观测音高之间的差值相对应的音级,来反映所述语音片段的观测音高的变动;以及由声音合成单元通过根据所述音高设置单元所产生的音高过渡而调整所述片段选择单元所选择的语音片段的音高,来产生所述声音信号。
-
公开(公告)号:CN109416911B
公开(公告)日:2023-07-21
申请号:CN201780040606.X
申请日:2017-06-28
申请人: 雅马哈株式会社
摘要: 声音合成方法具有:取得步骤,依次取得与声音的合成指示对应的多个声音片段;生成步骤,通过统计模型生成与合成指示对应的统计频谱包络;以及合成步骤,将依次取得的多个声音片段相互连接,并且,与生成的统计频谱包络对应地对各声音片段的频谱包络进行变更,基于具有变更后的频谱的连接后的声音片段,对声音信号进行合成。
-
公开(公告)号:CN112970058A
公开(公告)日:2021-06-15
申请号:CN201980072848.6
申请日:2019-11-06
申请人: 雅马哈株式会社
IPC分类号: G10L13/00 , G10L13/033 , G10L13/047
摘要: 信息处理系统具有合成处理部,该合成处理部将表示歌唱者的歌唱者数据、表示歌唱风格的风格数据和表示歌唱条件的合成数据输入至通过机器学习而生成的合成模型,由此基于该发音风格及发音条件而生成表示应该由歌唱者发音的目标音的音响特征的特征数据。
-
公开(公告)号:CN109952609A
公开(公告)日:2019-06-28
申请号:CN201780068063.2
申请日:2017-11-07
申请人: 雅马哈株式会社
IPC分类号: G10L13/00 , G10L13/033
摘要: 一个实施方式涉及的声音合成方法具有下述步骤:变更步骤,通过将合成声音的一部分期间中的合成频谱的时间序列基于声音表现的振幅频谱包络概略形状的时间序列进行变更,由此得到被赋予所述声音表现的变更频谱的时间序列;以及合成步骤,基于所述变更频谱的时间序列,对被赋予所述声音表现的声音样本的时间序列进行合成。
-
公开(公告)号:CN111837184A
公开(公告)日:2020-10-27
申请号:CN201980018441.5
申请日:2019-03-15
申请人: 雅马哈株式会社
IPC分类号: G10L21/013 , G10L21/007 , G10L25/51
摘要: 确定处理部与表示音符的音符数据相应地,对表示应附加于音符的语音表现的表现样本和附加该语音表现的表现期间进行确定,与表现样本及表现期间相应地确定与对语音信号中的表现期间内的部分附加语音表现的表现附加处理相关的处理参数。
-
公开(公告)号:CN109416911A
公开(公告)日:2019-03-01
申请号:CN201780040606.X
申请日:2017-06-28
申请人: 雅马哈株式会社
摘要: 声音合成方法具有:取得步骤,依次取得与声音的合成指示对应的多个声音片段;生成步骤,通过统计模型生成与合成指示对应的统计频谱包络;以及合成步骤,将依次取得的多个声音片段相互连接,并且,与生成的统计频谱包络对应地对各声音片段的频谱包络进行变更,基于具有变更后的频谱的连接后的声音片段,对声音信号进行合成。
-
公开(公告)号:CN105957515A
公开(公告)日:2016-09-21
申请号:CN201610124952.3
申请日:2016-03-04
申请人: 雅马哈株式会社
IPC分类号: G10L13/033 , G10H7/02 , G10L13/02
摘要: 本发明提供了声音合成方法、声音合成装置和存储声音合成程序的介质。一种声音合成方法,用于通过提取自参考声音的语音片段的连接而产生声音信号,所述方法包括:由片段选择单元顺序地选择所述语音片段;由音高设置单元设置音高过渡,在所述音高过渡中,根据与作为所述参考声音的声产生参考的参考音高和所述片段选择单元所选择的语音片段的观测音高之间的差值相对应的音级,来反映所述语音片段的观测音高的变动;以及由声音合成单元通过根据所述音高设置单元所产生的音高过渡而调整所述片段选择单元所选择的语音片段的音高,来产生所述声音信号。
-
公开(公告)号:CN100524456C
公开(公告)日:2009-08-05
申请号:CN03127551.6
申请日:2003-08-06
申请人: 雅马哈株式会社
摘要: 通过分析对应于由音素或音素链构成的声音合成单元的声音波形的频率来检测得频谱。在频谱上检测局部峰值,指定包括局部峰值的谱分布区域。对于每个谱分布区域,生成代表依频率轴而定的振幅谱分布的振幅谱数据,和依频率轴而定的相位谱分布的相位谱数据。调整振幅谱数据,以便根据输入音调音高沿频率轴移动由振幅谱数据表示的振幅谱分布,根据振幅谱数据的调整来调整由相位谱数据表示的相位谱分布。将谱密度和与所需音调音色对应的频谱包络调整到一起。将调整后的振幅谱数据和调整后的相位谱数据转换成时域的合成声音信号。
-
公开(公告)号:CN109952609B
公开(公告)日:2023-08-15
申请号:CN201780068063.2
申请日:2017-11-07
申请人: 雅马哈株式会社
IPC分类号: G10L13/00 , G10L13/033
摘要: 一个实施方式涉及的声音合成方法具有下述步骤:变更步骤,通过将合成声音的一部分期间中的合成频谱的时间序列基于声音表现的振幅频谱包络概略形状的时间序列进行变更,由此得到被赋予所述声音表现的变更频谱的时间序列;以及合成步骤,基于所述变更频谱的时间序列,对被赋予所述声音表现的声音样本的时间序列进行合成。
-
公开(公告)号:CN102810309B
公开(公告)日:2014-09-10
申请号:CN201210175478.9
申请日:2012-05-30
申请人: 雅马哈株式会社
IPC分类号: G10L13/04
摘要: 本发明提供了语音合成设备和语音合方法。在该语音合成设备中,音素段内插器部分获取音素段的与声音特性的第一值对应的第一音素段数据并获取该音素段的与该声音特性的第二值对应的第二音素段数据。第一音素段数据和第二音素段数据表示音素段的每个帧的频谱。音素段内插器在第一音素段数据的每个帧和与第一音素段数据的每个帧相对应的第二音素段数据的每个帧之间进行内插,从而产生音素段的与声音特性的目标值对应的音素段数据,其中该目标值不同于声音特性的第一值和第二值。语音合成器根据所产生的音素段数据来生成具有声音特性的目标值的语音信号。
-
-
-
-
-
-
-
-
-