基于多特征注意力融合的语音情感识别方法及系统

Invention Publication

CN118447880A 基于多特征注意力融合的语音情感识别方法及系统审中-实审

Please log in to see more content

Patent Title: 基于多特征注意力融合的语音情感识别方法及系统
Application No.: CN202410640457.2

Application Date: 2024-05-22
Publication No.: CN118447880A

Publication Date: 2024-08-06
Inventor: 汪付强 , 张佳男 , 张鹏 , 吴晓明 , 张建强 , 郝秋赟 , 马晓凤 , 赵微
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Applicant Address: 山东省济南市历下区科院路19号;
Assignee: 山东省计算中心(国家超级计算济南中心),齐鲁工业大学(山东省科学院)
Current Assignee: 山东省计算中心(国家超级计算济南中心),齐鲁工业大学(山东省科学院)
Current Assignee Address: 山东省济南市历下区科院路19号;
Agency: 济南圣达知识产权代理有限公司
Agent 黄海丽
Main IPC: G10L25/63
IPC: G10L25/63 ; G10L25/24 ; G10L25/18 ; G10L25/06 ; G10L25/30

Abstract:

本发明提供了一种基于多特征注意力融合的语音情感识别方法及系统，包括：基于获取的待识别语音信号,通过预处理获得语音信号的语谱图和梅尔频率倒谱系数；基于所述语谱图，通过时频特征提取获得语谱图特征；基于所述梅尔频率倒谱系数，利用预先训练的神经网络模型进行特征提取，获得梅尔频率倒谱系数特征；基于待识别语音信号，利用自动语音识别的预训练模型进行特征提取，获得W2E特征；分别将语谱图特征和W2E特征以及梅尔频率倒谱系数特征和W2E特征进行特征融合，获得第一融合特征和第二融合特征；基于所述第一融合特征和第二融合特征，通过全局融合获得最终的融合特征；基于获得的融合特征，利用预先训练的情感分类器，获得情感分类结果。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/48	.专门适用于特定用途
G10L25/51	..比较或判别
G10L25/63	...情感状态估计