发明公开
- 专利标题: 音频中音乐及音乐相对响度的联合检测方法
-
申请号: CN202010198682.7申请日: 2020-03-20
-
公开(公告)号: CN111429943A公开(公告)日: 2020-07-17
- 发明人: 吕建成 , 贾碧珏 , 彭玺 , 李茂 , 孙亚楠 , 黄晓明
- 申请人: 四川大学
- 申请人地址: 四川省成都市武侯区一环路南一段24号
- 专利权人: 四川大学
- 当前专利权人: 四川大学
- 当前专利权人地址: 四川省成都市武侯区一环路南一段24号
- 代理机构: 成都正华专利代理事务所
- 代理商 李蕊
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L25/03 ; G10L25/54 ; G10L25/78 ; G06N3/08 ; G06N3/04 ; G06K9/62
摘要:
本发明公开了一种音频中音乐及音乐相对响度的联合检测方法,其包括获取待检测音频,并对其进行预处理得到音频特征;将音频特征作为网络输入序列输入双任务音乐检测网络模型,输出每个时间步的三个预测分数;基于预测分数≥设定阈值或<设定阈值时标记为1或0,将每个时间步的预测分数转换成大小为(3,)的0-1预测向量,采用所有时间步的预测向量形成音乐相对响度检测序列;将预测向量的二三位置采用逻辑或运算合并得到大小为(2,)的0-1预测向量,采用逻辑或运算得到的所有预测向量形成音乐检测序列;将音乐相对响度检测序列和音乐检测序列转为可读的标注,得到音频包括起始时间、结束时间和类别的标注文件。
公开/授权文献
- CN111429943B 音频中音乐及音乐相对响度的联合检测方法 公开/授权日:2022-05-10