发明公开
- 专利标题: 一种歌曲人声检测方法及装置
-
申请号: CN202210954394.9申请日: 2022-08-10
-
公开(公告)号: CN115331703A公开(公告)日: 2022-11-11
- 发明人: 何朋
- 申请人: 成都开心音符科技有限公司
- 申请人地址: 四川省成都市高新区天府三街199号B区16层B3-2、B4、B5、B6单元
- 专利权人: 成都开心音符科技有限公司
- 当前专利权人: 成都开心音符科技有限公司
- 当前专利权人地址: 四川省成都市高新区天府三街199号B区16层B3-2、B4、B5、B6单元
- 代理机构: 四川和创智慧专利代理有限公司
- 代理商 王厚莉
- 主分类号: G10L25/81
- IPC分类号: G10L25/81 ; G10L25/78 ; G10L25/30 ; G06N3/04 ; G06N3/08
摘要:
本申请涉及音频处理技术领域,尤其涉及一种歌曲人声检测方法及装置,其方法包括获取待提取人声的音频数据,并对所述音频数据进行预处理;依据预设的特征提取策略提取预处理后的所述音频数据的音频特征;依据所述音频特征以及预设的人声识别模型,确定所述音频数据中每一音频帧为人声的概率值;当所述概率值达到预设的概率阈值时,则该概率值所对应的音频帧为人声帧;依据所述概率值和所述概率阈值确定所述音频数据中所有的所述人声帧,并确定所有的所述人声帧中时间序列为连续性关系的目标人声帧;依据所有的所述目标人声帧确定所述音频数据中的目标人声音频片段,用户可选择所需的人声音频片段用于后续编辑。