- 专利标题: 叠音检测方法、装置、计算机设备和存储介质
-
申请号: CN202211575846.9申请日: 2022-12-09
-
公开(公告)号: CN115579022B公开(公告)日: 2023-06-30
- 发明人: 黄文琦 , 林全郴 , 梁凌宇 , 戴珍 , 白昱阳 , 赵翔宇 , 郭尧
- 申请人: 南方电网数字电网研究院有限公司
- 申请人地址: 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
- 专利权人: 南方电网数字电网研究院有限公司
- 当前专利权人: 南方电网数字电网研究院股份有限公司
- 当前专利权人地址: 510700 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
- 代理机构: 华进联合专利商标代理有限公司
- 代理商 舒丁
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L15/06 ; G10L15/16 ; G10L25/30 ; G06N3/0499 ; G06N3/08
摘要:
本申请涉及一种叠音检测方法、装置、计算机设备、存储介质和计算机程序产品。通过将待检测音频的音频特征输入第一二分类模型,由第一二分类模型检测待检测音频中的人声音频特征,将人声音频特征输入第二二分类模型,由第二二分类模型检测人声音频特征中的叠音音频特征,并基于叠音音频特征确定叠音音频。其中叠音音频特征表示包含至少两种人声音频的音频特征,第一二分类模型和第二二分类模型分别基于人声音频样本和由至少两种人声音频样本合成得到的音频样本训练得到。相较于传统的通过单级模型进行检测的方式,本方案通过多个由合成叠音训练的二分类模型分别检测音频中的人声音频以及人声音频中的叠音音频,提高了叠音检测的准确度。
公开/授权文献
- CN115579022A 叠音检测方法、装置、计算机设备和存储介质 公开/授权日:2023-01-06