一种分布式低速语音通话方法

    公开(公告)号:CN107564535B

    公开(公告)日:2020-09-01

    申请号:CN201710754733.8

    申请日:2017-08-29

    摘要: 本发明公开了一种分布式低速语音通话方法。本发明实施例基于两个局域通信网络,均包括多个语音通信终端,并且网络之间为窄带通信方式,通过在两个局域通信网络的各个语音通信终端上分布式存储子码本和分布式处理,在两个局域网络之间只需传输子码本编号即可实现两个局域通信网络上的语音通信终端之间进行流畅且良好音质的语音通信。本发明实施例解决了因语音特征码本太长、单个语音通信终端处理能力有限以及网间带宽受限,难以实现两个网络上语音终端进行语音通信以及语音质量不高的难题,并且充分利用网络内部的分布式处理能力,提高了网络利用效率和处理能力。

    基于可分离深度自动编码技术的无监督噪声估计和语音增强方法

    公开(公告)号:CN105023580B

    公开(公告)日:2018-11-13

    申请号:CN201510357980.5

    申请日:2015-06-25

    IPC分类号: G10L21/0208 G10L19/008

    摘要: 本发明公开了一种基于可分离深度自动编码技术的无监督噪声估计和语音增强方法,包括事前处理和对被未知噪声污染的语音增强,可以灵活运用于各类语音处理场景:不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类等,并与经典的基于平稳性假设的谱估计算法SS和MMSE相比,本发明不再依赖于这种平稳性假设,可以较准确的估计出平稳或突变噪声的频谱;与基于隐马尔可夫和线性预测系数的算法相比,本发明不需要指定所处理非平稳噪声类型;与基于低秩结构的噪声估计方法相比,本发明无需噪声具有低秩重复结构。

    基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法

    公开(公告)号:CN102915742A

    公开(公告)日:2013-02-06

    申请号:CN201210428465.8

    申请日:2012-10-30

    摘要: 本发明公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法。该方法首先使用短时傅里叶变换将带噪语音时域波形变换到时频域从而得到带噪语音的幅度谱;利用低秩与稀疏矩阵分解算法将带噪语音的幅度谱分解为噪声幅度谱、语音幅度谱和残余噪声幅度谱三者之和;最后,利用短时傅里叶逆变换从语音的幅度谱中重构出的语音时域波形。本发明不需要语音和噪声的任何先验信息,属于无监督的单通道语噪分离方法,算法从带噪语音中直接分离出纯净语音,简单有效,特别适用于强噪声环境下的人声提取。

    基于卷积非负矩阵分解的语音转换方法

    公开(公告)号:CN102306492B

    公开(公告)日:2012-09-12

    申请号:CN201110267425.5

    申请日:2011-09-09

    IPC分类号: G10L15/06 G10L19/02 G10L13/02

    摘要: 本发明公开了一种基于卷积非负矩阵分解的语音转换方法,通过训练数据对变换模型进行训练,首先训练语音数据的时间对准及参数分解,使用卷积非负矩阵分解方法对STRAIGHT谱进行分析,分析源语音与目标语音的基音频率;基于训练模型对新输入语音进行转换:对于待转换的源语音数据采用STRAIGHT模型进行参数分解,基于卷积非负矩阵分解实现声道频谱参数的转换,基于训练阶段得到的基音频率的均值和方差,实现基音频率的转换,合成转换后的语音,即通过转换得到的STRAIGHT谱、基音频率及原始非周期分量合成转换后的语音。本发明提升了语音转换的训练效果,改善了变换语音的语音质量。

    基于卷积非负矩阵分解的语音转换方法

    公开(公告)号:CN102306492A

    公开(公告)日:2012-01-04

    申请号:CN201110267425.5

    申请日:2011-09-09

    IPC分类号: G10L15/06 G10L19/02 G10L13/02

    摘要: 本发明公开了一种基于卷积非负矩阵分解的语音转换方法,通过训练数据对变换模型进行训练,首先训练语音数据的时间对准及参数分解,使用卷积非负矩阵分解方法对STRAIGHT谱进行分析,分析源语音与目标语音的基音频率;基于训练模型对新输入语音进行转换:对于待转换的源语音数据采用STRAIGHT模型进行参数分解,基于卷积非负矩阵分解实现声道频谱参数的转换,基于训练阶段得到的基音频率的均值和方差,实现基音频率的转换,合成转换后的语音,即通过转换得到的STRAIGHT谱、基音频率及原始非周期分量合成转换后的语音。本发明提升了语音转换的训练效果,改善了变换语音的语音质量。

    一种分布式低速语音通话方法

    公开(公告)号:CN107564535A

    公开(公告)日:2018-01-09

    申请号:CN201710754733.8

    申请日:2017-08-29

    摘要: 本发明公开了一种分布式低速语音通话方法。本发明实施例基于两个局域通信网络,均包括多个语音通信终端,并且网络之间为窄带通信方式,通过在两个局域通信网络的各个语音通信终端上分布式存储子码本和分布式处理,在两个局域网络之间只需传输子码本编号即可实现两个局域通信网络上的语音通信终端之间进行流畅且良好音质的语音通信。本发明实施例解决了因语音特征码本太长、单个语音通信终端处理能力有限以及网间带宽受限,难以实现两个网络上语音终端进行语音通信以及语音质量不高的难题,并且充分利用网络内部的分布式处理能力,提高了网络利用效率和处理能力。

    基于可分离深度自动编码技术的无监督噪声估计和语音增强方法

    公开(公告)号:CN105023580A

    公开(公告)日:2015-11-04

    申请号:CN201510357980.5

    申请日:2015-06-25

    IPC分类号: G10L21/0208 G10L19/008

    摘要: 本发明公开了一种基于可分离深度自动编码技术的无监督噪声估计和语音增强方法,包括事前处理和对被未知噪声污染的语音增强,可以灵活运用于各类语音处理场景:不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类等,并与经典的基于平稳性假设的谱估计算法SS和MMSE相比,本发明不再依赖于这种平稳性假设,可以较准确的估计出平稳或突变噪声的频谱;与基于隐马尔可夫和线性预测系数的算法相比,本发明不需要指定所处理非平稳噪声类型;与基于低秩结构的噪声估计方法相比,本发明无需噪声具有低秩重复结构。

    基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法

    公开(公告)号:CN102915742B

    公开(公告)日:2014-07-30

    申请号:CN201210428465.8

    申请日:2012-10-30

    摘要: 本发明公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法。该方法首先使用短时傅里叶变换将带噪语音时域波形变换到时频域从而得到带噪语音的幅度谱;利用低秩与稀疏矩阵分解算法将带噪语音的幅度谱分解为噪声幅度谱、语音幅度谱和残余噪声幅度谱三者之和;最后,利用短时傅里叶逆变换从语音的幅度谱中重构出的语音时域波形。本发明不需要语音和噪声的任何先验信息,属于无监督的单通道语噪分离方法,算法从带噪语音中直接分离出纯净语音,简单有效,特别适用于强噪声环境下的人声提取。