基于嵌入增强的超短时说话人确认方法、设备及介质

    公开(公告)号:CN116612767B

    公开(公告)日:2023-10-13

    申请号:CN202310869117.2

    申请日:2023-07-17

    IPC分类号: G10L17/04 G10L17/18

    摘要: 本发明属于说话人确认技术领域,公开了一种基于嵌入增强的超短时说话人确认方法、设备及介质。本发明方法包括如下步骤:搭建网络模型,其包括预先训练好的说话人确认模型以及增强器模型;语音在网络模型中的处理流程如下:输入的语音首先经过说话人确认模型输出相对较差的第一说话人嵌入,紧接着该第一说话人嵌入输入到增强器模型后,得到相对较好的第二说话人嵌入;保持说话人确认模型的模型参数不变,使用训练语音对网络模型进行训练,从而优化增强器模型的模型参数,进而得到训练好的增强器模型;利用训练好的网络模型,对输入的语音进行说话人确。本发明利于提升现有的说话人确认模型在超短时条件下的说话人确认效果。

    基于嵌入增强的超短时说话人确认方法、设备及介质

    公开(公告)号:CN116612767A

    公开(公告)日:2023-08-18

    申请号:CN202310869117.2

    申请日:2023-07-17

    IPC分类号: G10L17/04 G10L17/18

    摘要: 本发明属于说话人确认技术领域,公开了一种基于嵌入增强的超短时说话人确认方法、设备及介质。本发明方法包括如下步骤:搭建网络模型,其包括预先训练好的说话人确认模型以及增强器模型;语音在网络模型中的处理流程如下:输入的语音首先经过说话人确认模型输出相对较差的第一说话人嵌入,紧接着该第一说话人嵌入输入到增强器模型后,得到相对较好的第二说话人嵌入;保持说话人确认模型的模型参数不变,使用训练语音对网络模型进行训练,从而优化增强器模型的模型参数,进而得到训练好的增强器模型;利用训练好的网络模型,对输入的语音进行说话人确。本发明利于提升现有的说话人确认模型在超短时条件下的说话人确认效果。