发明授权
- 专利标题: 一种基于多域信息融合的合成语音检测方法
-
申请号: CN202310415885.0申请日: 2023-04-19
-
公开(公告)号: CN116153336B公开(公告)日: 2023-07-21
- 发明人: 田野 , 汤跃忠 , 陈云坤 , 傅景楠 , 张晓灿 , 付泊暘
- 申请人: 北京中电慧声科技有限公司 , 中国电子科技集团公司第三研究所
- 申请人地址: 北京市朝阳区酒仙桥北路乙七号;
- 专利权人: 北京中电慧声科技有限公司,中国电子科技集团公司第三研究所
- 当前专利权人: 北京中电慧声科技有限公司,中国电子科技集团公司第三研究所
- 当前专利权人地址: 北京市朝阳区酒仙桥北路乙七号;
- 代理机构: 工业和信息化部电子专利中心
- 代理商 袁鸿
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L25/03 ; G10L25/18 ; G10L25/27
摘要:
本申请公开了一种基于多域信息融合的合成语音检测方法,包括:提取待检测的语音信号的多域声学特征;将提取的多域声学特征输入合成语音检测模型,以完成检测,所述合成语音检测模型,基于训练语音数据集,执行训练:分解出所述训练语音数据集中语音数据的有声段部分、静音段部分以及固有模态分量,基于所述语音数据的有声段部分、静音段以及固有模态分量部分,分别提取特征,将提取到的特征级联,作为多域声学特征;将所述训练语音数据集的语音数据的多域声学特征作为所述特征融合器的输入,执行训练;训练后的各浅层分类器、深度分类器用以输出融合的识别结果。本申请实施例通过多种手段综合提升合成语音检测模型的检测能力和泛化应用能力。
公开/授权文献
- CN116153336A 一种基于多域信息融合的合成语音检测方法 公开/授权日:2023-05-23