音频分离方法、音频分离模型的训练方法、装置及设备

发明公开

CN114446316A 音频分离方法、音频分离模型的训练方法、装置及设备审中-实审

请登陆查看更多内容

专利标题： 音频分离方法、音频分离模型的训练方法、装置及设备
申请号： CN202210101338.0

申请日： 2022-01-27
公开(公告)号： CN114446316A

公开(公告)日： 2022-05-06
发明人: 罗艺 , 李凯
申请人： 腾讯科技(深圳)有限公司
申请人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
专利权人： 腾讯科技(深圳)有限公司
当前专利权人： 腾讯科技(深圳)有限公司
当前专利权人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
主分类号： G10L21/0272
IPC分类号： G10L21/0272 ; G10L25/30

摘要：

本申请公开了一种音频分离方法、音频分离模型的训练方法、装置及设备，属于音频处理技术领域。所述方法包括：获取待处理的目标音频数据，目标音频数据中包括至少一个声源；确定目标音频数据的多个时频单元，时频单元用于表征目标音频数据中的声学信息；对于多个时频单元中的目标时频单元，基于目标时频单元对应的时频单元集合，确定目标时频单元对应的实值遮蔽信息；根据时频单元集合和实值遮蔽信息，确定目标时频单元对应的声源信息；基于多个时频单元分别对应的声源信息，从目标音频数据中确定目标声源目标音频数据。通过上述方法，在基本不改变音频分离过程的计算量的同时，能够提高音频分离模型的分离准确度性能。

公开/授权文献

CN114446316B 音频分离方法、音频分离模型的训练方法、装置及设备公开/授权日：2024-03-12

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）
G10L21/0272	..声音信号的分离