专利检索 ap:("中国人民解放军理工大学") AND inv:"贾冲" 第 1 页

1.

发明授权
一种分布式低速语音通话方法有权

公开(公告)号：CN107564535B

公开(公告)日：2020-09-01

申请号：CN201710754733.8

申请日：2017-08-29

申请人： 中国人民解放军理工大学

发明人： 邹霞 , 胡永刚 , 时文华 , 张雄伟 , 孙蒙 , 贾冲 , 李莉

IPC分类号： G10L19/00 , G10L19/032 , G10L19/26 , G10L25/03 , G10L25/87 , G10L25/93 , H04L1/00

摘要： 本发明公开了一种分布式低速语音通话方法。本发明实施例基于两个局域通信网络，均包括多个语音通信终端，并且网络之间为窄带通信方式，通过在两个局域通信网络的各个语音通信终端上分布式存储子码本和分布式处理，在两个局域网络之间只需传输子码本编号即可实现两个局域通信网络上的语音通信终端之间进行流畅且良好音质的语音通信。本发明实施例解决了因语音特征码本太长、单个语音通信终端处理能力有限以及网间带宽受限，难以实现两个网络上语音终端进行语音通信以及语音质量不高的难题，并且充分利用网络内部的分布式处理能力，提高了网络利用效率和处理能力。

2.

发明授权
基于可分离深度自动编码技术的无监督噪声估计和语音增强方法有权

公开(公告)号：CN105023580B

公开(公告)日：2018-11-13

申请号：CN201510357980.5

申请日：2015-06-25

申请人： 中国人民解放军理工大学

发明人： 孙蒙 , 李轶南 , 张雄伟 , 王艺敏 , 邹霞 , 贾冲 , 李莉

IPC分类号： G10L21/0208 , G10L19/008

摘要： 本发明公开了一种基于可分离深度自动编码技术的无监督噪声估计和语音增强方法，包括事前处理和对被未知噪声污染的语音增强，可以灵活运用于各类语音处理场景：不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类等，并与经典的基于平稳性假设的谱估计算法SS和MMSE相比，本发明不再依赖于这种平稳性假设，可以较准确的估计出平稳或突变噪声的频谱；与基于隐马尔可夫和线性预测系数的算法相比，本发明不需要指定所处理非平稳噪声类型；与基于低秩结构的噪声估计方法相比，本发明无需噪声具有低秩重复结构。

3.

发明公开
基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法有权

公开(公告)号：CN102915742A

公开(公告)日：2013-02-06

申请号：CN201210428465.8

申请日：2012-10-30

申请人： 中国人民解放军理工大学

发明人： 张雄伟 , 黄建军 , 吴海佳 , 贾冲 , 曾理 , 周彬

IPC分类号： G10L21/0224 , G10L21/0272 , G10L25/45

摘要： 本发明公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法。该方法首先使用短时傅里叶变换将带噪语音时域波形变换到时频域从而得到带噪语音的幅度谱；利用低秩与稀疏矩阵分解算法将带噪语音的幅度谱分解为噪声幅度谱、语音幅度谱和残余噪声幅度谱三者之和；最后，利用短时傅里叶逆变换从语音的幅度谱中重构出的语音时域波形。本发明不需要语音和噪声的任何先验信息，属于无监督的单通道语噪分离方法，算法从带噪语音中直接分离出纯净语音，简单有效，特别适用于强噪声环境下的人声提取。

4.

发明授权
基于卷积非负矩阵分解的语音转换方法失效

公开(公告)号：CN102306492B

公开(公告)日：2012-09-12

申请号：CN201110267425.5

申请日：2011-09-09

申请人： 中国人民解放军理工大学

发明人： 张雄伟 , 孙健 , 曹铁勇 , 孙新建 , 黄建军 , 杨吉斌 , 邹霞 , 贾冲

IPC分类号： G10L15/06 , G10L19/02 , G10L13/02

摘要： 本发明公开了一种基于卷积非负矩阵分解的语音转换方法，通过训练数据对变换模型进行训练，首先训练语音数据的时间对准及参数分解，使用卷积非负矩阵分解方法对STRAIGHT谱进行分析，分析源语音与目标语音的基音频率；基于训练模型对新输入语音进行转换：对于待转换的源语音数据采用STRAIGHT模型进行参数分解，基于卷积非负矩阵分解实现声道频谱参数的转换，基于训练阶段得到的基音频率的均值和方差，实现基音频率的转换，合成转换后的语音，即通过转换得到的STRAIGHT谱、基音频率及原始非周期分量合成转换后的语音。本发明提升了语音转换的训练效果，改善了变换语音的语音质量。

5.

发明公开
基于卷积非负矩阵分解的语音转换方法失效

公开(公告)号：CN102306492A

公开(公告)日：2012-01-04

申请号：CN201110267425.5

申请日：2011-09-09

申请人： 中国人民解放军理工大学

发明人： 张雄伟 , 孙健 , 曹铁勇 , 孙新建 , 黄建军 , 杨吉斌 , 邹霞 , 贾冲

IPC分类号： G10L15/06 , G10L19/02 , G10L13/02

摘要： 本发明公开了一种基于卷积非负矩阵分解的语音转换方法，通过训练数据对变换模型进行训练，首先训练语音数据的时间对准及参数分解，使用卷积非负矩阵分解方法对STRAIGHT谱进行分析，分析源语音与目标语音的基音频率；基于训练模型对新输入语音进行转换：对于待转换的源语音数据采用STRAIGHT模型进行参数分解，基于卷积非负矩阵分解实现声道频谱参数的转换，基于训练阶段得到的基音频率的均值和方差，实现基音频率的转换，合成转换后的语音，即通过转换得到的STRAIGHT谱、基音频率及原始非周期分量合成转换后的语音。本发明提升了语音转换的训练效果，改善了变换语音的语音质量。

6.

发明公开
一种分布式低速语音通话方法有权

公开(公告)号：CN107564535A

公开(公告)日：2018-01-09

申请号：CN201710754733.8

申请日：2017-08-29

申请人： 中国人民解放军理工大学

发明人： 邹霞 , 胡永刚 , 时文华 , 张雄伟 , 孙蒙 , 贾冲 , 李莉

IPC分类号： G10L19/00 , G10L19/032 , G10L19/26 , G10L25/03 , G10L25/87 , G10L25/93 , H04L1/00

摘要： 本发明公开了一种分布式低速语音通话方法。本发明实施例基于两个局域通信网络，均包括多个语音通信终端，并且网络之间为窄带通信方式，通过在两个局域通信网络的各个语音通信终端上分布式存储子码本和分布式处理，在两个局域网络之间只需传输子码本编号即可实现两个局域通信网络上的语音通信终端之间进行流畅且良好音质的语音通信。本发明实施例解决了因语音特征码本太长、单个语音通信终端处理能力有限以及网间带宽受限，难以实现两个网络上语音终端进行语音通信以及语音质量不高的难题，并且充分利用网络内部的分布式处理能力，提高了网络利用效率和处理能力。

7.

发明公开
基于可分离深度自动编码技术的无监督噪声估计和语音增强方法有权

公开(公告)号：CN105023580A

公开(公告)日：2015-11-04

申请号：CN201510357980.5

申请日：2015-06-25

申请人： 中国人民解放军理工大学

发明人： 孙蒙 , 李轶南 , 张雄伟 , 王艺敏 , 邹霞 , 贾冲 , 李莉

IPC分类号： G10L21/0208 , G10L19/008

摘要： 本发明公开了一种基于可分离深度自动编码技术的无监督噪声估计和语音增强方法，包括事前处理和对被未知噪声污染的语音增强，可以灵活运用于各类语音处理场景：不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类等，并与经典的基于平稳性假设的谱估计算法SS和MMSE相比，本发明不再依赖于这种平稳性假设，可以较准确的估计出平稳或突变噪声的频谱；与基于隐马尔可夫和线性预测系数的算法相比，本发明不需要指定所处理非平稳噪声类型；与基于低秩结构的噪声估计方法相比，本发明无需噪声具有低秩重复结构。

8.

发明授权
基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法有权

公开(公告)号：CN102915742B

公开(公告)日：2014-07-30

申请号：CN201210428465.8

申请日：2012-10-30

申请人： 中国人民解放军理工大学

发明人： 张雄伟 , 黄建军 , 吴海佳 , 贾冲 , 曾理 , 周彬

IPC分类号： G10L21/0224 , G10L21/0272 , G10L25/45

摘要： 本发明公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法。该方法首先使用短时傅里叶变换将带噪语音时域波形变换到时频域从而得到带噪语音的幅度谱；利用低秩与稀疏矩阵分解算法将带噪语音的幅度谱分解为噪声幅度谱、语音幅度谱和残余噪声幅度谱三者之和；最后，利用短时傅里叶逆变换从语音的幅度谱中重构出的语音时域波形。本发明不需要语音和噪声的任何先验信息，属于无监督的单通道语噪分离方法，算法从带噪语音中直接分离出纯净语音，简单有效，特别适用于强噪声环境下的人声提取。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类