一种融合不确定性的对抗强泛化语音情感识别方法

    公开(公告)号:CN118887977A

    公开(公告)日:2024-11-01

    申请号:CN202411169806.3

    申请日:2024-08-25

    Abstract: 本发明公开了一种融合不确定性的对抗强泛化语音情感识别方法,包括以下步骤:(1)获取包含多种情感的语音数据库,按个体划分为源域和目标域数据,提取源域及目标域的对数梅尔谱图特征;(2)对源域数据进行时移、速度增强等扩充,提取扩充数据的对数梅尔谱图特征;(3)搭建特征提取器、分类器和判别器网络,原始语音样本进行对抗训练;(4)设计不确定性样本筛选机制,利用经对抗训练后的识别网络模型计算样本的预测熵和标准差,通过不确定性筛选条件对预测向量进行筛选,并对满足筛选条件的向量打伪标签;(5)将筛选后的增强样本加入训练集;重复步骤(3)‑(5),直至预设轮次结束。在IEMOCAP上的仿真结果表明,该方法有效提高了模型的识别性能。

Patent Agency Ranking