使用深度神经网络从单输入生成高清晰度双耳语音信号的系统和方法

发明公开

CN117597733A 使用深度神经网络从单输入生成高清晰度双耳语音信号的系统和方法审中-实审

请登陆查看更多内容

专利标题： 使用深度神经网络从单输入生成高清晰度双耳语音信号的系统和方法
申请号： CN202180099543.1

申请日： 2021-06-30
公开(公告)号： CN117597733A

公开(公告)日： 2024-02-23
发明人: 陈景东 , 潘宁宁 , 王玉竹 , 杰卡布·贝内斯特
申请人： 西北工业大学
申请人地址： 陕西省西安市友谊西路127号
专利权人： 西北工业大学
当前专利权人： 西北工业大学
当前专利权人地址： 陕西省西安市友谊西路127号
代理机构： 北京泛华伟业知识产权代理有限公司
代理商 王博
国际申请： PCT/CN2021/103480 2021.06.30
国际公布： WO2023/272575 EN 2023.01.05
进入国家日期： 2023-12-18
主分类号： G10L21/0272
IPC分类号： G10L21/0272 ; G10L21/0364

摘要：

一种生成双耳信号的系统和方法，包括：通过处理装置接收包括语音分量和噪声分量的声音信号(104)，以及通过所述处理装置使用深度神经网络(DNN)将所述声音信号转换为第一信号和第二信号(106)。所述转换还包括：通过所述DNN的编码层将所述声音信号编码为潜在空间中的声音信号表示(108)；通过所述DNN的渲染层将所述声音信号表示渲染为潜在空间中的第一信号表示和第二信号表示(110)；以及通过所述DNN的解码层将所述第一信号表示解码为第一信号，以及将所述第二信号表示解码为第二信号(112)。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）
G10L21/0272	..声音信号的分离