发明授权
- 专利标题: 一种单通道语音分离系统
-
申请号: CN201910865008.7申请日: 2019-09-09
-
公开(公告)号: CN110544482B公开(公告)日: 2021-11-12
- 发明人: 温正棋 , 范存航
- 申请人: 北京中科智极科技有限公司
- 申请人地址: 北京市海淀区丰贤中路7号4号楼四层4083号
- 专利权人: 北京中科智极科技有限公司
- 当前专利权人: 北京中科智极科技有限公司
- 当前专利权人地址: 北京市海淀区丰贤中路7号4号楼四层4083号
- 代理机构: 厦门福贝知识产权代理事务所
- 代理商 陈远洋
- 主分类号: G10L17/02
- IPC分类号: G10L17/02 ; G10L17/04 ; G10L17/22 ; G10L21/0272
摘要:
本发明公开了一种单通道语音分离系统,该系统深度嵌入式特征提取模块、语音分离模块、区分性训练模块和联合训练模块,其中,深度嵌入式特征提取模块,用于作为深度嵌入式特征的提取器;语音分离模块,与深度嵌入式特征提取模块相连,是基于句子级别的排列不变性训练准则进行语音分离,训练从深度嵌入式特征到各个目标语音信号的映射模型;区分性训练模块,与语音分离模块相连,用于增大不同说话人之间的距离,同时减小相同说话人之间的距离,提高语音分离的性能;联合训练模块,用于联合训练和优化深度嵌入式特征提取模块与语音分离模块;使用该系统可以提高语音分离的性能,使分离后的语音更加清晰、可懂且音质更好。
公开/授权文献
- CN110544482A 一种单通道语音分离系统 公开/授权日:2019-12-06