发明授权
- 专利标题: 一种基于深度哈希的声纹检索方法
-
申请号: CN201910574215.7申请日: 2019-06-28
-
公开(公告)号: CN110309343B公开(公告)日: 2023-08-08
- 发明人: 李武军 , 樊磊 , 蒋庆远 , 余亚奇
- 申请人: 南京大学
- 申请人地址: 江苏省南京市栖霞区仙林大道163号
- 专利权人: 南京大学
- 当前专利权人: 南京大学
- 当前专利权人地址: 江苏省南京市栖霞区仙林大道163号
- 代理机构: 南京乐羽知行专利代理事务所
- 代理商 李玉平
- 主分类号: G06F16/61
- IPC分类号: G06F16/61 ; G06F16/63 ; G06F16/65 ; G06F16/683
摘要:
本发明公开了一种基于深度哈希的声纹检索方法,达到了声纹检索任务中存储空间低且检索高效的效果。该方法包括训练深度声纹哈希模型的步骤,构建哈希编码数据库的步骤,对查询语音在数据库中检索的步骤:首先构建端到端的深度神经网络结构,利用已标注过说话人身份的语音数据,训练深度神经网络模型,得到深度声纹哈希函数。之后通过深度声纹哈希函数计算训练集对应的哈希编码,构建数据库;对于新录入的语音数据,使用深度声纹哈希函数计算对应的哈希编码,实时增加到数据库。在检索过程中,对于给定的语音,使用深度声纹哈希函数计算对应的哈希编码,最后在数据库中基于索引或海明距离排序得到检索结果。
公开/授权文献
- CN110309343A 一种基于深度哈希的声纹检索方法 公开/授权日:2019-10-08