- 专利标题: 一种基于声纹比对和生成对抗网络的语音增强方法
-
申请号: CN201811353760.5申请日: 2018-11-14
-
公开(公告)号: CN109326302B公开(公告)日: 2022-11-08
- 发明人: 钟艳如 , 张家豪 , 赵帅杰 , 李芳 , 蓝如师 , 罗笑南
- 申请人: 桂林电子科技大学
- 申请人地址: 广西壮族自治区桂林市金鸡路1号
- 专利权人: 桂林电子科技大学
- 当前专利权人: 桂林电子科技大学
- 当前专利权人地址: 广西壮族自治区桂林市金鸡路1号
- 代理机构: 桂林市华杰专利商标事务所有限责任公司
- 代理商 杨雪梅
- 主分类号: G10L21/0208
- IPC分类号: G10L21/0208 ; G10L21/0264 ; G10L17/00
摘要:
本发明公开一种基于声纹比对和生成对抗网络的语音增强方法,1)建立三个语音数据库,分别对应声纹识别编码器、噪声分离系统和语音分离系统;2)训练声纹识别编码器提取目标说话者的声纹特征,得目标声纹特征;3)将带噪音频转化成语谱图送入噪声分离系统中的生成器中,得预测干净音频;4)将预测干净音频和真实干净音频送入噪声分离系统中的鉴别器训练;5)调整鉴别器权重参数,使鉴别器更好地分辨出真实干净音频和预测干净音频的区别,得到产生近乎真实的干净音频的生成器;6)将说话者的声音送入已经训练好的生成器中,生成预测干净语谱图,得到增强的语音信号。该方法规模小、计算低、易于移植、保持一定的空间不变性且去噪效果好。
公开/授权文献
- CN109326302A 一种基于声纹比对和生成对抗网络的语音增强方法 公开/授权日:2019-02-12