单声道的语音数据的角色识别方法及装置

发明授权

请登陆查看更多内容

专利标题： 单声道的语音数据的角色识别方法及装置
申请号： CN201910012155.X

申请日： 2019-01-07
公开(公告)号： CN109785846B

公开(公告)日： 2024-05-28
发明人: 顾艳梅 , 马骏 , 王少军
申请人： 平安科技(深圳)有限公司
申请人地址： 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
专利权人： 平安科技(深圳)有限公司
当前专利权人： 平安科技(深圳)有限公司
当前专利权人地址： 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
代理机构： 北京汇思诚业知识产权代理有限公司
代理商 冯晓平
主分类号： G10L17/22
IPC分类号： G10L17/22 ; G10L17/04 ; G10L17/02 ; G10L17/06

摘要：

本发明涉及人工智能领域，公开了一种单声道的语音数据的角色识别方法及装置。方法包括：对语音数据进行语音识别，以得到语音数据的录音信息和录音时长；其中，录音时长记录录音信息的时间长度；基于通用背景模型从录音信息中提取说话人的声音特征；根据录音时长确定对所述说话人的角色判断阈值；将说话人的声音特征与预存储的目标角色的声音特征进行相似度比对，以获得相似度比对结果；根据相似度比对结果与角色判断阈值之间的关系确定语音数据中的说话人是否为所述目标角色。本技术方案解决现有技术不适用实时的说话人识别、对于时长较短的录音识别正确率较低、对于角色识别没有纠错机制的问题。

公开/授权文献

CN109785846A 单声道的语音数据的角色识别方法及装置公开/授权日：2019-05-21

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L17/00	讲话者辨认或验证
G10L17/22	.交互程序，人-机界面