用于短语音说话人确认的生成对抗网络优化方法及系统

    公开(公告)号:CN114530156A

    公开(公告)日:2022-05-24

    申请号:CN202210178590.1

    申请日:2022-02-25

    摘要: 本说明书实施例提供了一种用于短语音说话人确认的生成对抗网络优化方法及系统,其中,方法包括:获取多对长、短语音声学特征样本;将短语音声学特征样本输入生成器进行拼接,得到生成的伪长语音声学特征样本;将伪长语音声学特征样本与获取的所述长语音声学特征样本分别输入说话人确认模型,通过说话人确认模型输出伪身份特征样本和真身份特征样本;将真身份特征样本和伪身份特征样本输入鉴别器和分类器,通过损失函数计算所述鉴别器和分类器的损失,并通过反向传播优化更新鉴别器、分类器和生成器的参数。以解决说话人确认系统随着语音时长变短判别效果变差的问题。

    基于小波神经网络的声纹特征提取模型构建方法及系统

    公开(公告)号:CN114141256A

    公开(公告)日:2022-03-04

    申请号:CN202111492798.2

    申请日:2021-12-08

    IPC分类号: G10L17/18 G10L17/04

    摘要: 本发明公开了一种基于小波神经网络的声纹特征提取模型构建方法及系统,所述方法包括:获取特定格式的声音数据,对所述声音数据进行预处理,转化为固定维度的声音信号;选择小波基函数,将所述小波基函数设置为神经网络隐藏层中神经元的传递激发函数,构造小波神经网络,设置训练参数;将所述声音信号输入所述小波神经网络进行计算,基于输出的预测值和真实值,根据所述训练参数对小波神经网络进行迭代训练,获得声纹特征提取模型。使用的小波神经网络模型训练简单,专业性要求低,得到的特征提取模型抗噪性能优秀,具有更强的表征能力。