基于星状生成对抗网络的说话人识别系统

    公开(公告)号:CN116612765A

    公开(公告)日:2023-08-18

    申请号:CN202310592838.3

    申请日:2023-05-24

    摘要: 本发明提供了基于星状生成对抗网络的说话人识别系统,使用流程包括如下步骤:首先将预训练多情感语音通过分帧,加窗,傅里叶快速变换处理为预训练多情感语谱图。再将预训练多情感语谱图设置说话人和情感标签,一同输入星状生成对抗网络训练说话人鉴别器,情感鉴别器与真实性鉴别器。然后将预训练多情感语谱图输入生成器并指定目标生成情感进行生成,训练生成器的生成能力。之后将注册用户中性语谱图输入星状生成对抗网络生成注册用户多情感语谱图。最后使用注册用户多情感语谱图训练说话人识别网络,并对待识别用户多情感语谱图进行说话人分类计算其概率,获取最终说话人识别结果。该系统解决了情感域不匹配带来的说话人识别精度下降问题。

    一种基于生成对抗网络的情感不对称说话人识别系统

    公开(公告)号:CN116543774A

    公开(公告)日:2023-08-04

    申请号:CN202310506098.7

    申请日:2023-05-06

    IPC分类号: G10L17/04 G10L17/18

    摘要: 本发明提供了一种基于生成对抗网络的情感不对称说话人识别系统,其使用流程包括如下步骤:首先将多种情感文本对应的语音通过预加重,分帧加窗与快速傅里叶变化转换为预学习多情感语谱图。其次使用预学习多情感语谱图训练生成对抗网络,通过整体损失监督生成对抗网络训练过程中中性与其余各种情感的语谱图互相转换。然后使用生成对抗网络将注册用户中性语谱图转化为其他情感语谱图,合并注册用户中性与其他情感得到用户注册多情感语谱图。最后利用用户注册多情感语谱图训练说话人识别网络,对待检测语音计算说话人分类概率,获得最终声纹识别结果。该系统解决了注册与实际应用场景语音情感不一致导致的说话人识别性能下降问题。