一种语音去重方法、装置、服务器及存储介质
摘要:
本发明实施例公开了一种语音去重方法、装置、服务器和存储介质,其中,语音去重方法包括:利用梅尔频率倒谱系数MFCC算法获取目标短语音的MFCC特征矩阵,并将MFCC特征矩阵转换为目标图像;基于深度学习模型和特征降维算法,提取目标图像的目标图像特征,并确定目标图像特征的目标索引;根据目标索引确定与各历史短语音相对应的各历史图像特征,利用各历史图像特征与目标图像特征之间的重复度,确定目标短语音是否为重复语音。本发明实施例克服了现有语音去重方法忽视了语音内容的深层信息,仅能对内容相似的两份语音进行粗略的评定的不足,并基于语音内容的层面,实现了快速有效地对语音数据进行去重处理。
公开/授权文献
0/0