发明公开
- 专利标题: 使用深度神经网络从单输入生成高清晰度双耳语音信号的系统和方法
-
申请号: CN202180099543.1申请日: 2021-06-30
-
公开(公告)号: CN117597733A公开(公告)日: 2024-02-23
- 发明人: 陈景东 , 潘宁宁 , 王玉竹 , 杰卡布·贝内斯特
- 申请人: 西北工业大学
- 申请人地址: 陕西省西安市友谊西路127号
- 专利权人: 西北工业大学
- 当前专利权人: 西北工业大学
- 当前专利权人地址: 陕西省西安市友谊西路127号
- 代理机构: 北京泛华伟业知识产权代理有限公司
- 代理商 王博
- 国际申请: PCT/CN2021/103480 2021.06.30
- 国际公布: WO2023/272575 EN 2023.01.05
- 进入国家日期: 2023-12-18
- 主分类号: G10L21/0272
- IPC分类号: G10L21/0272 ; G10L21/0364
摘要:
一种生成双耳信号的系统和方法,包括:通过处理装置接收包括语音分量和噪声分量的声音信号(104),以及通过所述处理装置使用深度神经网络(DNN)将所述声音信号转换为第一信号和第二信号(106)。所述转换还包括:通过所述DNN的编码层将所述声音信号编码为潜在空间中的声音信号表示(108);通过所述DNN的渲染层将所述声音信号表示渲染为潜在空间中的第一信号表示和第二信号表示(110);以及通过所述DNN的解码层将所述第一信号表示解码为第一信号,以及将所述第二信号表示解码为第二信号(112)。