-
公开(公告)号:CN117672202A
公开(公告)日:2024-03-08
申请号:CN202311671490.3
申请日:2023-12-07
申请人: 国网安徽省电力有限公司超高压分公司 , 合肥工业大学
发明人: 张俊杰 , 樊培培 , 谢佳 , 刘之奎 , 董浩声 , 徐亚艳 , 马晓薇 , 王昱哲 , 李永熙 , 丁超然 , 张有龙 , 刘峥嵘 , 廖军 , 蒋欣峰 , 李奇 , 王腾 , 李德亮 , 刘军 , 陈斌 , 陈国玮 , 李红梅
IPC分类号: G10L15/16 , G10L15/08 , G10L15/20 , G06V10/44 , G06V10/82 , G06V10/774 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06N3/045
摘要: 本发明涉及一种基于深度卷积生成对抗网络的环境声音分类方法,与现有技术相比解决了ESC识别率低、鲁棒性差的缺陷。本发明包括以下步骤:ESC音频数据的收集和预处理;ESC分类检测模型的构建和训练;待检测ESC音频数据的收集和预处理;环境声音分类结果的获得。本发明将ESC音频数据转化为语谱图像,通过图像判别网络模型与图像生成网络模型之间的对抗训练,增强了数据,提高了图像判别网络模型的识别能力,提高了ESC识别率。