-
公开(公告)号:CN116913305A
公开(公告)日:2023-10-20
申请号:CN202310928010.0
申请日:2023-07-27
Applicant: 南昌航空大学 , 朝阳聚声泰(信丰)科技有限公司
IPC: G10L21/0224 , G10L21/0232 , G10L21/0316 , G10L25/30
Abstract: 本发明涉及语音处理技术领域,尤其涉及一种基于切比雪夫展开式的语音增强方法,所述方法包括:对需增强的语音信号进行短时傅里叶变换;切比雪夫级数的零阶项网络采用U2‑Net网络结构对信号进行幅度先验估计,得到粗略估计的复频谱;切比雪夫级数的高阶项网络用来估计复频谱残差项,将其定义为目标频谱与粗谱之间的相位差以细化目标频谱,再将残差分量表述为各高阶切比雪夫项的组合,并用一个轻量级的可训练模块来取代相邻项之间的算法;根据切比雪夫级数进行叠加零阶项和高阶项,恢复目标频谱。本发明受到切比雪夫级数的启发,构建了一种模拟切比雪夫展开式的零阶项和高阶项的一个可解释的两阶段解耦式网络,得到最后增强的目标语音信号。
-
公开(公告)号:CN117174097A
公开(公告)日:2023-12-05
申请号:CN202311135746.9
申请日:2023-09-05
Applicant: 南昌航空大学 , 朝阳聚声泰(信丰)科技有限公司
Abstract: 本发明公开了一种基于新型跳跃连接机制的轻量化UNet语音增强方法。本方法首先对语音信号进行基于STDCT的语音特征提取,构建基于STDCT的实值UNet网络,利用STDCT隐含相位信息的特点达到降低计算复杂度的目的。其次建立基于通道交叉Transformer的新型跳跃连接机制。通过通道交叉融合模块CCFM融合来自不同编码器级别的多尺度语音特征,消除特征的语义差距;通过通道交叉注意力模块CCAM指导融合后的多尺度语音信息有效连接到解码器上,形成跳跃连接的新输出,实现语音增强效果的有效提升。最后使用逆短时离散余弦变换ISTDCT波形重建将信号转换回时域信号,重建增强后的语音信号。本发明方法只需要较少的模型参数和计算量,适合低计算资源情景下的语音增强任务。
-