一种语音去重方法、装置、服务器及存储介质

发明授权

CN108847251B 一种语音去重方法、装置、服务器及存储介质有权转让

请登陆查看更多内容

专利标题： 一种语音去重方法、装置、服务器及存储介质
申请号： CN201810724991.6

申请日： 2018-07-04
公开(公告)号： CN108847251B

公开(公告)日： 2022-12-02
发明人: 杨小龙 , 张文明 , 陈少杰
申请人： 武汉斗鱼网络科技有限公司
申请人地址： 湖北省武汉市武汉东湖开发区软件园东路1号软件产业4.1期B1栋11楼
专利权人： 武汉斗鱼网络科技有限公司
当前专利权人： 航天国盛科技有限公司
当前专利权人地址： 100080 北京市海淀区莲花苑5号楼6层601室
代理机构： 北京品源专利代理有限公司
代理商 孟金喆
主分类号： G10L25/24
IPC分类号： G10L25/24 ; G10L25/27 ; G10L25/48 ; G06K9/62

摘要：

本发明实施例公开了一种语音去重方法、装置、服务器和存储介质，其中，语音去重方法包括：利用梅尔频率倒谱系数MFCC算法获取目标短语音的MFCC特征矩阵，并将MFCC特征矩阵转换为目标图像；基于深度学习模型和特征降维算法，提取目标图像的目标图像特征，并确定目标图像特征的目标索引；根据目标索引确定与各历史短语音相对应的各历史图像特征，利用各历史图像特征与目标图像特征之间的重复度，确定目标短语音是否为重复语音。本发明实施例克服了现有语音去重方法忽视了语音内容的深层信息，仅能对内容相似的两份语音进行粗略的评定的不足，并基于语音内容的层面，实现了快速有效地对语音数据进行去重处理。

公开/授权文献

CN108847251A 一种语音去重方法、装置、服务器及存储介质公开/授权日：2018-11-20

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/03	.以提取参数类型为特征的
G10L25/24	..提取参数的倒谱