-
公开(公告)号:CN104347080A
公开(公告)日:2015-02-11
申请号:CN201410392430.2
申请日:2014-08-11
申请人: 雅马哈株式会社
发明人: 橘诚
IPC分类号: G10L25/03 , G10L13/033
CPC分类号: G10H1/361 , G10H7/00 , G10H7/008 , G10H7/02 , G10H2210/00 , G10H2210/051 , G10H2210/066 , G10H2210/091 , G10H2210/095 , G10H2210/325 , G10H2210/331 , G10H2220/155 , G10H2240/121 , G10H2250/455 , G10L13/00 , G10L13/0335 , G10L13/06 , G10L13/10
摘要: 本发明公开了语音分析装置和语音分析方法,该语音分析方法包括产生相对音高的时间序列的变量提取步骤。所述相对音高是从乐曲数据产生的在时间轴上连续波动的音高和参考语音的音高之差。所述乐曲数据按时间序列指定乐曲的各个音符。所述参考语音是通过歌唱所述乐曲而得到的语音。通过对其中未检测到音高的无语音区间进行插值处理来处理所述参考语音的音高。所述语音分析方法还包括特性分析步骤,其产生定义了用于表示在所述变量提取步骤中产生的相对音高的时间序列的模型的歌唱特性数据。
-
公开(公告)号:CN105659322B
公开(公告)日:2019-07-05
申请号:CN201480051931.2
申请日:2014-09-17
申请人: 微软技术许可有限责任公司
IPC分类号: G10L25/90
CPC分类号: G06N5/02 , G10H2210/031 , G10H2210/325 , G10H2210/375 , G10H2210/555 , G11B27/031
摘要: 自动地生成对多个音频样本或音频样本集合中的至少一个附加音频样本或音频样本集合的推荐以与特定音频样本或音频样本集合组合。该推荐是通过确定特定音频样本或样本集合与多个音频样本或音频样本集合中的每一者的节奏兼容性以及和声兼容性来生成的。对于多个音频样本或音频样本集合中的每一者,基于该音频样本或音频样本集合与特定音频样本或音频样本集合的节奏兼容性及和声兼容性来生成兼容性评级。多个音频样本或音频样本集合中的至少一者被计算设备作为与特定音频样本或音频样本集合组合的推荐来呈现。
-
公开(公告)号:CN105706161B
公开(公告)日:2019-07-09
申请号:CN201480051936.5
申请日:2014-09-17
申请人: 微软技术许可有限责任公司
CPC分类号: H03G5/16 , G10H1/0025 , G10H7/00 , G10H2210/066 , G10H2210/081 , G10H2210/125 , G10H2210/325 , G10H2210/555 , G10H2250/641
摘要: 标识了两个音频样本和/或两组音频样本。标识了各音频样本和/或各组音频样本的音高分布,一音频样本或一组音频样本的音高分布是指多个音符音高的每一个音高有多少存在于该音频样本或该组音频样本中。基于各音频样本和/或各组音频样本的音高分布,可以自动调节一个音频样本和/或一组音频样本的至少一个音高(但不必要取决于音高分布)以提高各音频样本和/或各组音频样本的和声相干性。
-
公开(公告)号:CN105706161A
公开(公告)日:2016-06-22
申请号:CN201480051936.5
申请日:2014-09-17
申请人: 微软技术许可有限责任公司
CPC分类号: H03G5/16 , G10H1/0025 , G10H7/00 , G10H2210/066 , G10H2210/081 , G10H2210/125 , G10H2210/325 , G10H2210/555 , G10H2250/641
摘要: 标识了两个音频样本和/或两组音频样本。标识了各音频样本和/或各组音频样本的音高分布,一音频样本或一组音频样本的音高分布是指多个音符音高的每一个音高有多少存在于该音频样本或该组音频样本中。基于各音频样本和/或各组音频样本的音高分布,可以自动调节一个音频样本和/或一组音频样本的至少一个音高(但不必要取决于音高分布)以提高各音频样本和/或各组音频样本的和声相干性。
-
公开(公告)号:CN1511312A
公开(公告)日:2004-07-07
申请号:CN02808144.7
申请日:2002-02-12
申请人: 多尔拜实验特许公司
发明人: 布莱特·克罗克特
IPC分类号: G10L19/04
CPC分类号: G10L21/04 , G10H2210/325 , G10H2210/375 , G10H2250/541 , G10L21/003 , G10L25/87 , H04N5/04 , H04N5/60
摘要: 在一种可选实施方式中,使用多个心理声学标准分析一个音频信号以识别出在其中进行时间标度和/或音调偏移处理将是不可听的或者最低可听性的一个信号区域,并在该区域内时间标度和/或音调偏移该信号。在另一种可选实施方式中,将信号划分成多个听觉事件,并在一个听觉事件内时间标度和/或音调偏移该信号。在又一种可选实施方式中,将信号划分成多个听觉事件,使用一个心理声学标准分析这些听觉事件以识别出在其中进行信号的时间标度和/或音调偏移处理将是不可听的或者最低可听性的那些听觉事件。还为音频的多声道提供了其它的可选实施方式。
-
公开(公告)号:CN104036764B
公开(公告)日:2018-08-17
申请号:CN201410078630.0
申请日:2014-03-05
申请人: 雅马哈株式会社
发明人: 山内明
CPC分类号: G10H1/38 , G10H1/02 , G10H1/20 , G10H1/28 , G10H1/36 , G10H1/366 , G10H2210/005 , G10H2210/221 , G10H2210/335 , G10H2210/395 , G10H2210/571 , G10H2220/251 , G10H2210/325
摘要: 一种乐音信息处理设备和方法。如果音符事件中包括弯音事件,则作为对弯音事件的控制响应的结果,根据音符事件将要发声的一个乐音在音高上从由音符事件指定的音符音高连续地变化到另一个音符音高。对于基于伴奏模式、谐音音符等的音符的发声,根据指定和弦来转换与音符事件对应的音高,因此,不仅与音符事件对应的音符音高而且还有响应于弯音事件的其他音符音高都应该被恰当地转换。因此,进行布置以准确地判定不可从音符事件本身表示的音符音高识别的响应于弯音的其他音符音高并根据指定和弦转换其他音符音高。另外,在乐音的波形数据包括在音高上连续变化的弯音波形数据的场合,能够以类似以上的方式恰当地转换弯音波形数据中包括的各音符音高。
-
公开(公告)号:CN104347080B
公开(公告)日:2018-08-10
申请号:CN201410392430.2
申请日:2014-08-11
申请人: 雅马哈株式会社
发明人: 橘诚
IPC分类号: G10L25/03 , G10L13/033
CPC分类号: G10H1/361 , G10H7/00 , G10H7/008 , G10H7/02 , G10H2210/00 , G10H2210/051 , G10H2210/066 , G10H2210/091 , G10H2210/095 , G10H2210/325 , G10H2210/331 , G10H2220/155 , G10H2240/121 , G10H2250/455 , G10L13/00 , G10L13/0335 , G10L13/06 , G10L13/10
摘要: 本发明公开了语音分析装置和语音分析方法,该语音分析方法包括产生相对音高的时间序列的变量提取步骤。所述相对音高是从乐曲数据产生的在时间轴上连续波动的音高和参考语音的音高之差。所述乐曲数据按时间序列指定乐曲的各个音符。所述参考语音是通过歌唱所述乐曲而得到的语音。通过对其中未检测到音高的无语音区间进行插值处理来处理所述参考语音的音高。所述语音分析方法还包括特性分析步骤,其产生定义了用于表示在所述变量提取步骤中产生的相对音高的时间序列的模型的歌唱特性数据。
-
公开(公告)号:CN103514874A
公开(公告)日:2014-01-15
申请号:CN201310261608.5
申请日:2013-06-27
申请人: 雅马哈株式会社
IPC分类号: G10L13/02
CPC分类号: G10L13/04 , G10H7/02 , G10H7/12 , G10H2210/325 , G10H2220/011 , G10H2220/126 , G10H2240/145 , G10H2250/455 , G10L13/0335 , G10L13/08
摘要: 本发明公开了一种声音合成方法和声音合成设备。该声音合成设备连接到显示装置并包括处理器,该处理器被配置成:在显示装置的屏幕上显示歌词;在屏幕上显示出歌词之后,输入基于用户的操作的音高;以及基于输入的音高来输出代表显示的歌词的歌声的一条波形数据。
-
公开(公告)号:CN1279511C
公开(公告)日:2006-10-11
申请号:CN02808144.7
申请日:2002-02-12
申请人: 多尔拜实验特许公司
发明人: 布莱特·克罗克特
IPC分类号: G10L19/04
CPC分类号: G10L21/04 , G10H2210/325 , G10H2210/375 , G10H2250/541 , G10L21/003 , G10L25/87 , H04N5/04 , H04N5/60
摘要: 在一种可选实施方式中,使用多个心理声学标准分析一个音频信号以识别出在其中进行时间标度和/或音调偏移处理将是不可听的或者最低可听性的一个信号区域,并在该区域内时间标度和/或音调偏移该信号。在另一种可选实施方式中,将信号划分成多个听觉事件,并在一个听觉事件内时间标度和/或音调偏移该信号。在又一种可选实施方式中,将信号划分成多个听觉事件,使用一个心理声学标准分析这些听觉事件以识别出在其中进行信号的时间标度和/或音调偏移处理将是不可听的或者最低可听性的那些听觉事件。还为音频的多声道提供了其它的可选实施方式。
-
公开(公告)号:CN107919113A
公开(公告)日:2018-04-17
申请号:CN201710928161.0
申请日:2017-10-09
申请人: 卡西欧计算机株式会社
发明人: 野津友美
IPC分类号: G10H7/00
CPC分类号: G10H1/0008 , G10H1/0075 , G10H1/02 , G10H1/46 , G10H7/008 , G10H2220/221 , G10H2240/005 , G10H7/00 , G10H2210/101 , G10H2210/325 , G10H2210/341 , G10H2250/471
摘要: 一种乐音再生装置,具备:音源部,根据用于指示应该实现的乐音状态的指示数据的接收,以成为所指示的上述乐音状态的方式使乐音一边依次变化一边产生;插补部,使用存储器内的数据,根据作为输入数据所包含的值的、与乐音所对应的区间和在上述区间中再生的上述乐音的变化量相关的值,生成对与上述区间对应的输入数据进行了插补而得到的多个插补数据;以及再生控制部,根据上述多个插补数据,生成用于指示在上述区间内的多个定时应该实现的乐音状态的多个指示数据,在上述区间的乐音的再生时,将生成的上述多个指示数据向上述音源部依次发送。
-
-
-
-
-
-
-
-
-