一种基于多域信息融合的合成语音检测方法

发明授权

请登陆查看更多内容

专利标题： 一种基于多域信息融合的合成语音检测方法
申请号： CN202310415885.0

申请日： 2023-04-19
公开(公告)号： CN116153336B

公开(公告)日： 2023-07-21
发明人: 田野 , 汤跃忠 , 陈云坤 , 傅景楠 , 张晓灿 , 付泊暘
申请人： 北京中电慧声科技有限公司 , 中国电子科技集团公司第三研究所
申请人地址： 北京市朝阳区酒仙桥北路乙七号;
专利权人： 北京中电慧声科技有限公司,中国电子科技集团公司第三研究所
当前专利权人： 北京中电慧声科技有限公司,中国电子科技集团公司第三研究所
当前专利权人地址： 北京市朝阳区酒仙桥北路乙七号;
代理机构： 工业和信息化部电子专利中心
代理商 袁鸿
主分类号： G10L25/51
IPC分类号： G10L25/51 ; G10L25/03 ; G10L25/18 ; G10L25/27

摘要：

本申请公开了一种基于多域信息融合的合成语音检测方法，包括：提取待检测的语音信号的多域声学特征；将提取的多域声学特征输入合成语音检测模型，以完成检测，所述合成语音检测模型，基于训练语音数据集，执行训练：分解出所述训练语音数据集中语音数据的有声段部分、静音段部分以及固有模态分量，基于所述语音数据的有声段部分、静音段以及固有模态分量部分，分别提取特征，将提取到的特征级联，作为多域声学特征；将所述训练语音数据集的语音数据的多域声学特征作为所述特征融合器的输入，执行训练；训练后的各浅层分类器、深度分类器用以输出融合的识别结果。本申请实施例通过多种手段综合提升合成语音检测模型的检测能力和泛化应用能力。

公开/授权文献

CN116153336A 一种基于多域信息融合的合成语音检测方法公开/授权日：2023-05-23

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/48	.专门适用于特定用途
G10L25/51	..比较或判别