一种基于DFT的双通道语声分离方法

    公开(公告)号:CN107017005B

    公开(公告)日:2020-03-24

    申请号:CN201710287632.4

    申请日:2017-04-27

    申请人: 同济大学

    IPC分类号: G10L21/0308 H04S1/00

    摘要: 本发明涉及一种基于DFT的双通道语声分离方法,包括以下步骤:S1,分别对左声道和右声道的时域信号序列分片,进行DFT变换,得到左声道和右声道的频域信号序列;S2,获取左、右声道背景音乐分量之间的夹角条件,以及语声分量与频点信号之间的夹角条件,将语声和音乐分离;S3,对步骤S2得到的结果进行DFT反变换,得到语声和音乐分离后的左声道和右声道的时域信号。与现有技术相比,本发明通过利用分片的离散傅里叶变换,可以将背景音乐和语声有效分离;考虑拾音系统的角度范围和拾音系统两通道之间的距离,确定了不同的相差条件,从而使计算结果更加准确;对得到的最后结果进行滤波,滤除不必要的噪声,可应用于K歌类型的手机应用程序中。

    一种基于DFT的双通道语声分离方法

    公开(公告)号:CN107017005A

    公开(公告)日:2017-08-04

    申请号:CN201710287632.4

    申请日:2017-04-27

    申请人: 同济大学

    IPC分类号: G10L21/0308 H04S1/00

    摘要: 本发明涉及一种基于DFT的双通道语声分离方法,包括以下步骤:S1,分别对左声道和右声道的时域信号序列分片,进行DFT变换,得到左声道和右声道的频域信号序列;S2,获取左、右声道背景音乐分量之间的夹角条件,以及语声分量与频点信号之间的夹角条件,将语声和音乐分离;S3,对步骤S2得到的结果进行DFT反变换,得到语声和音乐分离后的左声道和右声道的时域信号。与现有技术相比,本发明通过利用分片的离散傅里叶变换,可以将背景音乐和语声有效分离;考虑拾音系统的角度范围和拾音系统两通道之间的距离,确定了不同的相差条件,从而使计算结果更加准确;对得到的最后结果进行滤波,滤除不必要的噪声,可应用于K歌类型的手机应用程序中。