- 专利标题: 一种语音的重复音频检测方法、装置及存储介质
-
申请号: CN202211597936.8申请日: 2022-12-14
-
公开(公告)号: CN115641856B公开(公告)日: 2023-03-28
- 发明人: 郑榕 , 孟凡芹
- 申请人: 北京远鉴信息技术有限公司
- 申请人地址: 北京市海淀区西四环北路158号1幢7层80001-2
- 专利权人: 北京远鉴信息技术有限公司
- 当前专利权人: 北京远鉴信息技术有限公司
- 当前专利权人地址: 北京市海淀区西四环北路158号1幢7层80001-2
- 代理机构: 北京超凡宏宇专利代理事务所
- 代理商 刘凤
- 主分类号: G10L19/02
- IPC分类号: G10L19/02 ; G10L25/03 ; G10L25/30 ; G10L25/51
摘要:
本申请提供了一种语音的重复音频检测方法、装置及存储介质,重复音频检测方法包括:对待检测语音进行分帧处理,对分帧处理后的待检测语音进行短时傅里叶变换特征提取;将多个短时傅里叶变换特征输入至预先训练好的重复音频检测模型的检测网络之中,确定出特征分段后的多个目标候选帧;将特征分段后多个目标候选帧输入至重复音频检测模型的编码器网络之中,确定出每个特征分段对应的嵌入表征特征向量;将各个特征分段对应的嵌入表征特征向量输入至重复音频检测模型的瓶颈网络之中,进行相似度计算,确定出待检测语音是否存在重复音频,若存在,则确定出重复音频的音频位置信息,提升了语音复制检测定位的检测速度以及准确性。
公开/授权文献
- CN115641856A 一种语音的重复音频检测方法、装置及存储介质 公开/授权日:2023-01-24