发明公开
- 专利标题: 基于多粒度注意力机制的深度合成音频检测方法和装置
-
申请号: CN202310802442.7申请日: 2023-07-03
-
公开(公告)号: CN116825137A公开(公告)日: 2023-09-29
- 发明人: 贾云刚 , 孙捷 , 刘铭 , 张震 , 马宏远 , 石瑾 , 高一骄 , 段东圣 , 段运强 , 李鹏 , 时磊 , 赵淳璐 , 常为领 , 佟玲玲 , 孙海亮
- 申请人: 国家计算机网络与信息安全管理中心天津分中心
- 申请人地址: 天津市南开区南门外大街盛欣园A座
- 专利权人: 国家计算机网络与信息安全管理中心天津分中心
- 当前专利权人: 国家计算机网络与信息安全管理中心天津分中心
- 当前专利权人地址: 天津市南开区南门外大街盛欣园A座
- 代理机构: 北京中知音诺知识产权代理事务所
- 代理商 湛海耀
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L25/03 ; G10L25/18 ; G10L25/30 ; G10L25/27 ; G06N3/0464 ; G06N3/092
摘要:
本发明属于深度合成音频检测领域技术领域,特别涉及一种基于多粒度注意力机制的深度合成音频检测方法和装置,其中,深度合成音频检测方法包括以下步骤:获取待检测音频;对待检测音频进行预处理,得到对应的频谱图;对频谱图进行多粒度特征提取,得到不同时间尺度的中间特征;对不同时间尺度的中间特征采用多粒度注意力机制进行特征融合,得到多粒度特征;将多粒度特征输入预训练好的深度合成音频检测模型中,输出对应的预测结果。本发明提供的深度合成音频检测方法多粒度注意力机制,结合深度学习技术,充分利用音频信号的时频特征,提高对不同时序的关注能力,从而提高音频检测的准确性和鲁棒性。