Invention Application
- Patent Title: 融合多种端到端神经网络结构的说话人感冒症状识别方法
- Patent Title (English): WO2018166316A1 - Speaker's flu symptoms recognition method fused with multiple end-to-end neural network structures
-
Application No.: PCT/CN2018/076272Application Date: 2018-02-11
-
Publication No.: WO2018166316A1Publication Date: 2018-09-20
- Inventor: 李明 , 倪志东
- Applicant: 佛山市顺德区中山大学研究院 , 广东顺德中山大学卡内基梅隆大学国际联合研究院 , 中山大学
- Applicant Address: 中国广东省佛山市顺德区大良街道办事处云路社区居民委员会南国东路9号, Guangdong 528399 CN
- Assignee: 佛山市顺德区中山大学研究院,广东顺德中山大学卡内基梅隆大学国际联合研究院,中山大学
- Current Assignee: 佛山市顺德区中山大学研究院,广东顺德中山大学卡内基梅隆大学国际联合研究院,中山大学
- Current Assignee Address: 中国广东省佛山市顺德区大良街道办事处云路社区居民委员会南国东路9号, Guangdong 528399 CN
- Agency: 广州嘉权专利商标事务所有限公司
- Priority: CN201710146957.0 20170313
- Main IPC: G10L25/66
- IPC: G10L25/66 ; G10L25/30 ; G10L25/24
Abstract:
融合多种端到端深度学习结构的说话人感冒症状识别方法,由4个端到端的神经网络组成,当输入为原始语音或者语音频谱时,通过卷积神经网络提取最优特征,最后接长短期记忆网络或者全连接网络进行分类;当输入为梅尔倒谱系数(MFCC)或者常数Q倒谱系数(CQCC)时,直接通过长短期记忆网络进行分类,最后把这些系统融合在一起,整个流程把特征提取和模型分类两个问题统一在一起,使得整个说话人感冒症状识别过程更加简单快速。
Information query