基于多特征注意力融合的语音情感识别方法及系统
Abstract:
本发明提供了一种基于多特征注意力融合的语音情感识别方法及系统,包括:基于获取的待识别语音信号,通过预处理获得语音信号的语谱图和梅尔频率倒谱系数;基于所述语谱图,通过时频特征提取获得语谱图特征;基于所述梅尔频率倒谱系数,利用预先训练的神经网络模型进行特征提取,获得梅尔频率倒谱系数特征;基于待识别语音信号,利用自动语音识别的预训练模型进行特征提取,获得W2E特征;分别将语谱图特征和W2E特征以及梅尔频率倒谱系数特征和W2E特征进行特征融合,获得第一融合特征和第二融合特征;基于所述第一融合特征和第二融合特征,通过全局融合获得最终的融合特征;基于获得的融合特征,利用预先训练的情感分类器,获得情感分类结果。
Patent Agency Ranking
0/0