伪造语音检测模型的训练方法、伪造语音检测方法及设备

发明公开

CN118366433A 伪造语音检测模型的训练方法、伪造语音检测方法及设备审中-实审

请登陆查看更多内容

专利标题： 伪造语音检测模型的训练方法、伪造语音检测方法及设备
申请号： CN202410442526.9

申请日： 2024-04-12
公开(公告)号： CN118366433A

公开(公告)日： 2024-07-19
发明人: 曹雪峰 , 张岩 , 刘妮妮 , 吴扬峰 , 姜锦涛
申请人： 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
申请人地址： 河北省保定市容城县奥威路南88号; ; ;
专利权人： 中移雄安信息通信科技有限公司,中移系统集成有限公司,中国移动通信集团有限公司,中移信息系统集成有限公司
当前专利权人： 中移雄安信息通信科技有限公司,中移系统集成有限公司,中国移动通信集团有限公司,中移信息系统集成有限公司
当前专利权人地址： 河北省保定市容城县奥威路南88号; ; ;
代理机构： 北京国昊天诚知识产权代理有限公司
代理商 叶碧莲
主分类号： G10L15/06
IPC分类号： G10L15/06 ; G10L15/02 ; G10L15/16 ; G10L15/24 ; G06F18/214 ; G06F18/25 ; G06N3/042 ; G06N3/0464 ; G06N3/0442 ; G06N3/08

摘要：

本申请公开一种伪造语音检测模型的训练方法、伪造语音检测方法及设备，属于多媒体安全技术领域。该方法包括：获取多个音频样本文件；从多个音频样本文件的文本数据和音频数据中提取多模态样本特征，对多模态样本特征进行特征融合处理，得到各个音频样本文件对应的融合特征；使用多个音频样本文件对应的融合特征对预先构建的自蒸馏声学模型进行迭代训练，得到伪造语音检测模型。这样，能够使自蒸馏声学模型充分挖掘不同模态特征之间的相关性，提高模型的表达能力和泛化能力，从而有利于提高伪造语音检测模型对伪造语音检测的准确率。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）