音频信号区分器和编码器
    41.
    发明公开

    公开(公告)号:CN106463141A

    公开(公告)日:2017-02-22

    申请号:CN201580023968.9

    申请日:2015-05-07

    摘要: 本发明涉及编解码器和区分器以及其中用于音频信号区分和编码的方法。编码器执行的方法的实施例包括,针对音频信号的分段:识别频谱峰值的集合;确定所述集合中峰值之间的平均距离S;以及确定峰值包络与噪声基底包络之间的比率PNR。所述方法还包括:至少基于所述平均距离S和比率PNR,从多个编码模式中选择编码模式;以及应用所选编码模式,用于所述音频信号的分段的编码。

    一种音频信号分类方法和装置

    公开(公告)号:CN106409313A

    公开(公告)日:2017-02-15

    申请号:CN201610860627.3

    申请日:2013-08-06

    发明人: 王喆

    IPC分类号: G10L25/81 G10L25/18 G10L25/78

    摘要: 本发明实施例公开了一种音频信号分类方法和装置,用于对输入的音频信号进行分类,该方法包括:根据当前音频帧的声音活动性,确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中,其中,所述频谱波动表示音频信号的频谱的能量波动;根据音频帧是否为敲击音乐或历史音频帧的活动性,更新频谱波动存储器中存储的频谱波动;根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量,将所述当前音频帧分类为语音帧或者音乐帧。

    基于车载录音设备的多音区抢麦方法、系统、车辆和介质

    公开(公告)号:CN118692494A

    公开(公告)日:2024-09-24

    申请号:CN202410803428.3

    申请日:2024-06-20

    摘要: 本申请涉及智能驾驶技术领域,具体涉及基于车载录音设备的多音区抢麦方法、系统、车辆和介质。本申请利用多个车载录音设备同时录取不同音区的声音,获得多路声音数据;按照预设数据格式和数据位深对多路声音数据进行分解,获得每个音区对应的单路声音数据;基于单路声音数据,获得每个音区对应的伴奏音频数据,并分别与相应的单路声音数据进行对比,获得最快最准确的目标声音数据,从而实现抢麦结果。本发明基于车辆座舱内多个方位已安装好的拾音麦克风,录取座舱内不同音区的单路声音数据,并与伴奏音频数据进行单独对比,从而筛选出最快最准确的目标声音数据,实现良好的K歌体验,能增强用户的交互和乘坐体验,并提高对硬件资源的利用率。

    噪声检测的方法和装置
    44.
    发明授权

    公开(公告)号:CN112614512B

    公开(公告)日:2024-07-19

    申请号:CN202011504715.2

    申请日:2020-12-18

    发明人: 陈洲旋

    IPC分类号: G10L25/81 G10L25/87

    摘要: 本申请提供了一种噪声检测的方法,属于音频处理技术领域。所述方法包括:在目标音频中确定待定噪声音频段,其中,所述待定噪声音频段中的每个音频帧均满足噪声参数条件,且与所述待定噪声音频段相邻的音频帧均不满足所述噪声参数条件;确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长满足预设条件的至少一个参考音频段;基于所述待定噪声音频段、所述至少一个参考音频段以及噪声判定模型,确定所述待定噪声音频段对应的噪声判定结果,其中,所述噪声判定结果用于指示所述待定噪声音频段是否存在噪声。采用本申请,不需要对目标音频中的所有音频段都进行复杂的模型处理,节省了检测时间,提高了检测效率。

    确定合唱歌词分配信息的方法、装置、设备及存储介质

    公开(公告)号:CN112150997B

    公开(公告)日:2024-07-19

    申请号:CN202011013567.4

    申请日:2020-09-24

    发明人: 庄晓滨

    IPC分类号: G10H1/36 G10L25/03 G10L25/81

    摘要: 本申请公开了一种确定合唱歌词分配信息的方法,属于互联网技术领域。所述方法包括:提取目标歌曲音频中的人声音频;基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,将所述多个发声音频段确定为所述目标歌曲音频的各句歌词对应的演唱音频段;基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,其中,所述合唱歌词分配信息中包括所述目标歌曲音频的每句歌词对应的演唱者。采用本申请能够提高得到合唱歌词分配信息的效率。

    一种歌曲演唱的评价方法、设备及介质

    公开(公告)号:CN113096689B

    公开(公告)日:2024-06-14

    申请号:CN202110360784.9

    申请日:2021-04-02

    发明人: 闫震海

    摘要: 本申请公开了一种歌曲演唱的评价方法、设备及介质,包括:获取标准歌曲中的节拍信息;获取用户演唱所述标准歌曲的用户人声信号,对用户人声信号进行逐字分割,提取每个字起始点的时间信息,得到用户人声信号的字起始点时间信息;从节拍信息中确定与字起始点时间信息中每个字起始点的时间信息对应的节拍点的时间信息,得到目标节拍点时间信息;对字起始点时间信息与目标节拍点时间信息进行比对,得到用户人声信号中每个字起始点的时间信息与目标节拍点时间信息中相应的节拍点的时间信息之间的时间偏差值;基于每个字起始点对应的时间偏差值评价歌曲演唱。这样,能够提升歌曲演唱的评价的准确度,以及歌曲演唱的评价的效率。

    重叠人声检测模型的训练方法、重叠人声检测方法及装置

    公开(公告)号:CN117765977A

    公开(公告)日:2024-03-26

    申请号:CN202311840989.2

    申请日:2023-12-28

    发明人: 罗程方

    摘要: 本申请实施例提供了一种重叠人声检测模型的训练方法、重叠人声检测方法及装置,涉及音频检测和音频处理技术领域。所述重叠人声检测模型的训练方法包括:获取重叠人声检测模型的训练样本集,训练样本集中包括至少一个训练样本,每个训练样本包括一段歌曲音频以及歌曲音频对应的重叠人声标注结果;通过重叠人声检测模型输出歌曲音频对应的重叠人声检测结果,重叠人声检测结果用于指示歌曲音频中的各个帧分别对应的重叠人声概率值;根据重叠人声检测结果和重叠人声标注结果之间的差异,对重叠人声检测模型的参数进行调整,得到训练后的重叠人声检测模型。采用本申请实施例提供的技术方案,能够提高对歌曲音频中的重叠人声的检测准确率。

    歌词转换点检测方法、装置、计算机设备及存储介质

    公开(公告)号:CN113516971B

    公开(公告)日:2023-09-29

    申请号:CN202110775920.0

    申请日:2021-07-09

    发明人: 萧博耀 高旋

    IPC分类号: G10L15/04 G10L25/81

    摘要: 本发明实施例公开了一种歌词转换点检测方法、装置、计算机设备及存储介质,涉及音频处理技术领域。其中方法包括:获取目标音频数据;对目标音频数据进行检测以得到目标音频数据的节拍;对目标音频数据进行人声分离处理以得到人声数据;计算人声数据的幅值以得到人声能量波形;对人声能量波形进行预处理以得到目标波形;根据目标音频数据的节拍以及预设转换条件对目标波形进行检测以确定歌词的转换点。该方法实现了机器设备对音乐和人声的有效识别,并通过目标音频数据的节拍以及预设转换条件来检测经过处理后的人声数据实现精准地确定歌词的转换点,大大提高了对歌词转换点定位的精度以及效率。

    歌曲评分信息生成方法、计算机设备和存储介质

    公开(公告)号:CN116564348A

    公开(公告)日:2023-08-08

    申请号:CN202310362242.4

    申请日:2023-03-29

    摘要: 本申请涉及一种歌曲评分信息生成方法、计算机设备和存储介质。所述方法包括:对目标歌曲音频进行音源分离,得到目标歌曲音频的伴奏音频和人声音频,根据伴奏音频的伴奏音质特征和人声音频的人声音质特征,确定目标歌曲音频的音质评分信息,根据人声音频的音频基频特征,确定目标歌曲音频的旋律评分信息,根据伴奏音频的伴奏混音特征和人声音频的人声混音特征,确定目标歌曲音频的制作评分信息,根据音质评分信息、旋律评分信息和制作评分信息,生成目标歌曲音频的歌曲评分信息。采用本方法能够对歌曲音频进行多维度评分和基于多维度评分的综合评分,摆脱歌曲评分参考的限制,对歌曲进行多维度的可解释评分,从而提高歌曲评分信息的准确度。

    音频信号区分器和编码器
    50.
    发明授权

    公开(公告)号:CN110619891B

    公开(公告)日:2023-01-17

    申请号:CN201910918149.0

    申请日:2015-05-07

    摘要: 本发明涉及编解码器和区分器以及其中用于音频信号区分和编码的方法。编码器执行的方法的实施例包括,针对音频信号的分段:识别频谱峰值的集合;确定所述集合中峰值之间的平均距离S;以及确定峰值包络与噪声基底包络之间的比率PNR。所述方法还包括:至少基于所述平均距离S和比率PNR,从多个编码模式中选择编码模式;以及应用所选编码模式,用于所述音频信号的分段的编码。