融合多种端到端神经网络结构的说话人感冒症状识别方法
Abstract:
融合多种端到端深度学习结构的说话人感冒症状识别方法,由4个端到端的神经网络组成,当输入为原始语音或者语音频谱时,通过卷积神经网络提取最优特征,最后接长短期记忆网络或者全连接网络进行分类;当输入为梅尔倒谱系数(MFCC)或者常数Q倒谱系数(CQCC)时,直接通过长短期记忆网络进行分类,最后把这些系统融合在一起,整个流程把特征提取和模型分类两个问题统一在一起,使得整个说话人感冒症状识别过程更加简单快速。
Patent Agency Ranking
0/0