一种基于声纹比对和生成对抗网络的语音增强方法

发明授权

CN109326302B 一种基于声纹比对和生成对抗网络的语音增强方法有权

请登陆查看更多内容

专利标题： 一种基于声纹比对和生成对抗网络的语音增强方法
申请号： CN201811353760.5

申请日： 2018-11-14
公开(公告)号： CN109326302B

公开(公告)日： 2022-11-08
发明人: 钟艳如 , 张家豪 , 赵帅杰 , 李芳 , 蓝如师 , 罗笑南
申请人： 桂林电子科技大学
申请人地址： 广西壮族自治区桂林市金鸡路1号
专利权人： 桂林电子科技大学
当前专利权人： 桂林电子科技大学
当前专利权人地址： 广西壮族自治区桂林市金鸡路1号
代理机构： 桂林市华杰专利商标事务所有限责任公司
代理商 杨雪梅
主分类号： G10L21/0208
IPC分类号： G10L21/0208 ; G10L21/0264 ; G10L17/00

摘要：

本发明公开一种基于声纹比对和生成对抗网络的语音增强方法，1）建立三个语音数据库,分别对应声纹识别编码器、噪声分离系统和语音分离系统；2）训练声纹识别编码器提取目标说话者的声纹特征，得目标声纹特征；3）将带噪音频转化成语谱图送入噪声分离系统中的生成器中，得预测干净音频；4）将预测干净音频和真实干净音频送入噪声分离系统中的鉴别器训练；5）调整鉴别器权重参数，使鉴别器更好地分辨出真实干净音频和预测干净音频的区别，得到产生近乎真实的干净音频的生成器；6）将说话者的声音送入已经训练好的生成器中，生成预测干净语谱图，得到增强的语音信号。该方法规模小、计算低、易于移植、保持一定的空间不变性且去噪效果好。

公开/授权文献

CN109326302A 一种基于声纹比对和生成对抗网络的语音增强方法公开/授权日：2019-02-12

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）
G10L21/0208	..噪声过滤