Invention Publication
- Patent Title: 基于多特征注意力融合的语音情感识别方法及系统
-
Application No.: CN202410640457.2Application Date: 2024-05-22
-
Publication No.: CN118447880APublication Date: 2024-08-06
- Inventor: 汪付强 , 张佳男 , 张鹏 , 吴晓明 , 张建强 , 郝秋赟 , 马晓凤 , 赵微
- Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
- Applicant Address: 山东省济南市历下区科院路19号;
- Assignee: 山东省计算中心(国家超级计算济南中心),齐鲁工业大学(山东省科学院)
- Current Assignee: 山东省计算中心(国家超级计算济南中心),齐鲁工业大学(山东省科学院)
- Current Assignee Address: 山东省济南市历下区科院路19号;
- Agency: 济南圣达知识产权代理有限公司
- Agent 黄海丽
- Main IPC: G10L25/63
- IPC: G10L25/63 ; G10L25/24 ; G10L25/18 ; G10L25/06 ; G10L25/30

Abstract:
本发明提供了一种基于多特征注意力融合的语音情感识别方法及系统,包括:基于获取的待识别语音信号,通过预处理获得语音信号的语谱图和梅尔频率倒谱系数;基于所述语谱图,通过时频特征提取获得语谱图特征;基于所述梅尔频率倒谱系数,利用预先训练的神经网络模型进行特征提取,获得梅尔频率倒谱系数特征;基于待识别语音信号,利用自动语音识别的预训练模型进行特征提取,获得W2E特征;分别将语谱图特征和W2E特征以及梅尔频率倒谱系数特征和W2E特征进行特征融合,获得第一融合特征和第二融合特征;基于所述第一融合特征和第二融合特征,通过全局融合获得最终的融合特征;基于获得的融合特征,利用预先训练的情感分类器,获得情感分类结果。
Information query