发明授权
- 专利标题: 一种语音去重方法、装置、服务器及存储介质
-
申请号: CN201810724991.6申请日: 2018-07-04
-
公开(公告)号: CN108847251B公开(公告)日: 2022-12-02
- 发明人: 杨小龙 , 张文明 , 陈少杰
- 申请人: 武汉斗鱼网络科技有限公司
- 申请人地址: 湖北省武汉市武汉东湖开发区软件园东路1号软件产业4.1期B1栋11楼
- 专利权人: 武汉斗鱼网络科技有限公司
- 当前专利权人: 航天国盛科技有限公司
- 当前专利权人地址: 100080 北京市海淀区莲花苑5号楼6层601室
- 代理机构: 北京品源专利代理有限公司
- 代理商 孟金喆
- 主分类号: G10L25/24
- IPC分类号: G10L25/24 ; G10L25/27 ; G10L25/48 ; G06K9/62
摘要:
本发明实施例公开了一种语音去重方法、装置、服务器和存储介质,其中,语音去重方法包括:利用梅尔频率倒谱系数MFCC算法获取目标短语音的MFCC特征矩阵,并将MFCC特征矩阵转换为目标图像;基于深度学习模型和特征降维算法,提取目标图像的目标图像特征,并确定目标图像特征的目标索引;根据目标索引确定与各历史短语音相对应的各历史图像特征,利用各历史图像特征与目标图像特征之间的重复度,确定目标短语音是否为重复语音。本发明实施例克服了现有语音去重方法忽视了语音内容的深层信息,仅能对内容相似的两份语音进行粗略的评定的不足,并基于语音内容的层面,实现了快速有效地对语音数据进行去重处理。
公开/授权文献
- CN108847251A 一种语音去重方法、装置、服务器及存储介质 公开/授权日:2018-11-20