发明公开
- 专利标题: 音频分离方法、音频分离模型的训练方法、装置及设备
-
申请号: CN202210101338.0申请日: 2022-01-27
-
公开(公告)号: CN114446316A公开(公告)日: 2022-05-06
- 发明人: 罗艺 , 李凯
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 主分类号: G10L21/0272
- IPC分类号: G10L21/0272 ; G10L25/30
摘要:
本申请公开了一种音频分离方法、音频分离模型的训练方法、装置及设备,属于音频处理技术领域。所述方法包括:获取待处理的目标音频数据,目标音频数据中包括至少一个声源;确定目标音频数据的多个时频单元,时频单元用于表征目标音频数据中的声学信息;对于多个时频单元中的目标时频单元,基于目标时频单元对应的时频单元集合,确定目标时频单元对应的实值遮蔽信息;根据时频单元集合和实值遮蔽信息,确定目标时频单元对应的声源信息;基于多个时频单元分别对应的声源信息,从目标音频数据中确定目标声源目标音频数据。通过上述方法,在基本不改变音频分离过程的计算量的同时,能够提高音频分离模型的分离准确度性能。
公开/授权文献
- CN114446316B 音频分离方法、音频分离模型的训练方法、装置及设备 公开/授权日:2024-03-12