发明公开
- 专利标题: 一种语音情感识别方法和装置
-
申请号: CN202210378453.2申请日: 2022-04-06
-
公开(公告)号: CN116935897A公开(公告)日: 2023-10-24
- 发明人: 赵东明 , 王敏辉 , 陈萍
- 申请人: 中国移动通信集团天津有限公司 , 中国移动通信集团有限公司
- 申请人地址: 天津市天津港保税区M区64号;
- 专利权人: 中国移动通信集团天津有限公司,中国移动通信集团有限公司
- 当前专利权人: 中国移动通信集团天津有限公司,中国移动通信集团有限公司
- 当前专利权人地址: 天津市天津港保税区M区64号;
- 代理机构: 北京国昊天诚知识产权代理有限公司
- 代理商 许振新
- 主分类号: G10L25/63
- IPC分类号: G10L25/63 ; G10L25/30 ; G10L25/03
摘要:
本发明公开了一种语音情感识别方法和装置,用以解决语音情感识别不准确的问题。本方案包括:获取待识别的语音音频和基于语音音频识别得到的语音文本;对语音音频和语音文本分别执行特征提取,以获取音频特征序列和文本特征序列;根据双向长短期记忆网络模型对音频特征序列和文本特征序列分别执行特征编码,以获取音频特征编码结果和文本特征编码结果;对音频特征编码结果和文本特征编码结果基于隐藏状态执行特征对齐,以获取特征对齐后的融合特征序列;基于支持向量机对融合特征序列执行分类,以确定语音音频的情感识别结果。本方案采用支持向量机执行情感分类,实现网络结构优化,能高效识别两极情绪,提升情感识别准确性。