音频校准方法、装置及存储介质

    公开(公告)号:CN111785238B

    公开(公告)日:2024-02-27

    申请号:CN202010590868.7

    申请日:2020-06-24

    发明人: 李胜存

    IPC分类号: G10L25/51 G10H1/02

    摘要: 本发明实施例公开了一种音频校准方法、装置及存储介质。该方案可以获取翻唱音频以及标准音频,并分别计算翻唱音频当中每个字的音高与标准音频中每个字的音高,及其每个对应字的音高之间的偏差值,根据偏差值对翻唱音频进行校准,以得到翻唱音频中每个字的修复音频,根据偏差值确定翻唱音频中每个字的刻度影射值,实时获取刻度设置值,并将刻度设置值与翻唱音频中每个字的刻度影射值进行对比,根据对比结果从每个字的修复音频以及翻唱音频当中选取目标音频进行输出。本申请实施例通过翻唱音频当中每个字的音高与标准音频中对应字的音高之间的偏差值来设置刻度影射值,从而结合刻度设置值实时调节音频的校准程度,提升音频校准

    音频校准方法、装置及存储介质
    2.
    发明公开

    公开(公告)号:CN111785238A

    公开(公告)日:2020-10-16

    申请号:CN202010590868.7

    申请日:2020-06-24

    发明人: 李胜存

    IPC分类号: G10H1/02 G10H1/36 G10L25/51

    摘要: 本发明实施例公开了一种音频校准方法、装置及存储介质。该方案可以获取翻唱音频以及标准音频,并分别计算翻唱音频当中每个字的音高与标准音频中每个字的音高,及其每个对应字的音高之间的偏差值,根据偏差值对翻唱音频进行校准,以得到翻唱音频中每个字的修复音频,根据偏差值确定翻唱音频中每个字的刻度影射值,实时获取刻度设置值,并将刻度设置值与翻唱音频中每个字的刻度影射值进行对比,根据对比结果从每个字的修复音频以及翻唱音频当中选取目标音频进行输出。本申请实施例通过翻唱音频当中每个字的音高与标准音频中对应字的音高之间的偏差值来设置刻度影射值,从而结合刻度设置值实时调节音频的校准程度,提升音频校准的效率。

    音频处理方法、装置及存储介质

    公开(公告)号:CN110599989B

    公开(公告)日:2022-11-29

    申请号:CN201910942105.1

    申请日:2019-09-30

    IPC分类号: G10H1/36

    摘要: 本发明实施例公开了一种音频处理方法、装置及存储介质。该方案通过获取目标音频资源的原唱音频并进行分割,得到第一伴奏音频以及混合音频,混合音频包括伴奏与人声,分别计算第一伴奏音频与混合音频的响度,基于第一伴奏音频与混合音频的响度计算第一人声音频的响度,获取目标音频资源的翻唱音频,并根据第一伴奏音频与第一人声音频的响度,分别对翻唱音频中分割后的第二伴奏音频与第二人声音频的响度进行调整。本申请实施例所提供的方案通过计算原唱音频中的人声及伴奏的响度,并以此调节翻唱作品中的人声及伴奏,使得更加接近于原唱,提升了针对翻唱音乐的音频处理效果以及响度调节的准确性。

    音频处理方法、装置及存储介质

    公开(公告)号:CN109817241B

    公开(公告)日:2021-06-01

    申请号:CN201910120377.3

    申请日:2019-02-18

    发明人: 陈颖 李胜存

    摘要: 本发明公开了一种音频处理方法、装置及存储介质,方法包括:将能量值中大于能量阈值的能量值所对应的音频片段确定为待检测音频片段;将待检测音频片段中片段时长小于预设时长的音频片段确定为待处理音频片段;根据与待处理音频片段相邻的N帧信号的幅值以及待处理音频片段的幅值确定衰减系数;根据衰减系数对待处理音频片段进行去噪处理,得到处理后的音频信号。本发明实施例将音频信号中能量值大于预设能量值的音频片段确定为待检测音频片段,然后将片段时长小于预设时长的待检测音频片段确定为待处理音频片段,最后对该待处理音频片段进行去噪处理,本方案可以准确获取瞬时噪声对应的音频片段,进而有效去除音频信号中的瞬时噪声。

    歌曲调性识别方法及装置

    公开(公告)号:CN108231046A

    公开(公告)日:2018-06-29

    申请号:CN201711463382.1

    申请日:2017-12-28

    发明人: 李胜存

    IPC分类号: G10H1/00

    摘要: 本发明实施例提供了一种歌曲调性识别方法及装置,所述歌曲调性识别方法包括:获取歌曲的乐谱信息;根据所述歌曲的乐谱信息以及预设调性的音阶、主音和所述主音的协和音,计算所述预设调性在所述歌曲的各个指定位置的得分;根据所述预设调性在所述歌曲的各个指定位置的得分以及所述各个指定位置的权重,评估所述预设调性的匹配度得分;根据所述预设调性的匹配度得分确定所述歌曲的调性。本发明实施例能够准确识别出歌曲的调性,为歌曲分析提供有效的参考依据。

    音频处理方法、装置及存储介质

    公开(公告)号:CN111739496B

    公开(公告)日:2023-06-23

    申请号:CN202010589210.4

    申请日:2020-06-24

    发明人: 李胜存

    IPC分类号: G10H1/36

    摘要: 本发明实施例公开了一种音频处理方法、装置及存储介质。该方案可以获取多路音频数据,并对多路音频数据中的每路音频数据进行音量调节,对经过音量调节后的多路音频数据分别进行第一压限处理,以使每路音频数据的音量处于预设音量范围内,将经过第一压限处理后的多路音频数据通过加法电路计算数和,以得到初始合成数据,对初始合成信号进行第二压限处理,生成目标合成数据。本申请实施例所提供的方案可以合成前针对每一路音量进行调节并应用第一阶段压限,合成后再应用第二阶段压限从而实现平滑防溢出,从而提升合成后的音频质量。

    音频合成方法、装置及计算机可读存储介质

    公开(公告)号:CN111640411B

    公开(公告)日:2023-04-18

    申请号:CN202010482211.9

    申请日:2020-05-29

    IPC分类号: G10H7/00

    摘要: 本发明实施例公开了一种音频合成方法、装置及计算机可读存储介质,其中,该方法包括:客户端获取目标音频的干声音频数据和伴奏音频数据;根据目标音频的参考伴奏起始点,获取目标音频的干声子数据,以及目标音频的伴奏子数据;客户端对干声子数据和伴奏子数据进行合成,得到合成子音频;客户端计算合成子音频与参考子音频之间的音频相似度;若音频相似度符合音频合成条件,则根据音频相似度确定目标时间偏移值;根据目标时间偏移值,将目标音频的干声音频数据和伴奏音频数据进行合成,得到目标合成音频。通过该技术方案能够解决伴奏和人声之间的延迟问题。

    音频连接方法及装置
    8.
    发明授权

    公开(公告)号:CN108766407B

    公开(公告)日:2023-03-24

    申请号:CN201810463718.2

    申请日:2018-05-15

    发明人: 李胜存

    IPC分类号: G10H1/00

    摘要: 本发明公开了一种音频连接方法及装置,属于音频处理领域。方法包括获取用于音频连接的第一音频,在第一音频中确定第一过渡小节;根据第一音频的和弦编配信息,确定第一过渡小节对应的和弦信息;根据第一过渡小节的和弦信息,从音频库中获取与第一过渡小节匹配的第二过渡小节及其对应的第二音频;基于第一过渡小节、第二过渡小节,采用预设过渡算法,将第一音频和第二音频进行连接。本发明通过将两个音频在具有相同和弦信息的过渡小节进行连接,使得连接得到的音频能够满足和声乐理且符合听觉乐感,达到了两个音频快速平滑连接的目的,提高了音频连接的效率和智能性,且音频的可选范围大,灵活性好。

    气口位置检测方法及相关设备
    9.
    发明公开

    公开(公告)号:CN111968623A

    公开(公告)日:2020-11-20

    申请号:CN202010837183.8

    申请日:2020-08-19

    发明人: 李胜存

    摘要: 本申请实施例公开了一种气口位置检测方法及相关设备,用于检测目标歌曲中的气口位置。本申请实施例方法包括:分别对人声数据进行VAD算法检测和基频检测,并计算目标音频段的重合率,该重合率为VAD非激活段与基频非激活段重合的音频段在目标音频段中的时长占比,也就是该重合的音频段的时长与目标音频段的时长的比值,并确定重合率在预设数值范围内的目标音频段为目标歌曲的气口位置。本申请实施例中,使用VAD检测结果来验证基频检测结果,使用基频检测结果来验证VAD检测结果,通过VAD算法检测和基频检测的相互验证和相互校正,可以使最终的检测结果更趋于真实结果,从而提高气口位置检测的准确率。

    音频合成方法、装置及计算机可读存储介质

    公开(公告)号:CN111640411A

    公开(公告)日:2020-09-08

    申请号:CN202010482211.9

    申请日:2020-05-29

    IPC分类号: G10H7/00

    摘要: 本发明实施例公开了一种音频合成方法、装置及计算机可读存储介质,其中,该方法包括:客户端获取目标音频的干声音频数据和伴奏音频数据;根据目标音频的参考伴奏起始点,获取目标音频的干声子数据,以及目标音频的伴奏子数据;客户端对干声子数据和伴奏子数据进行合成,得到合成子音频;客户端计算合成子音频与参考子音频之间的音频相似度;若音频相似度符合音频合成条件,则根据音频相似度确定目标时间偏移值;根据目标时间偏移值,将目标音频的干声音频数据和伴奏音频数据进行合成,得到目标合成音频。通过该技术方案能够解决伴奏和人声之间的延迟问题。