发明授权
- 专利标题: 单声道的语音数据的角色识别方法及装置
-
申请号: CN201910012155.X申请日: 2019-01-07
-
公开(公告)号: CN109785846B公开(公告)日: 2024-05-28
- 发明人: 顾艳梅 , 马骏 , 王少军
- 申请人: 平安科技(深圳)有限公司
- 申请人地址: 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
- 专利权人: 平安科技(深圳)有限公司
- 当前专利权人: 平安科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
- 代理机构: 北京汇思诚业知识产权代理有限公司
- 代理商 冯晓平
- 主分类号: G10L17/22
- IPC分类号: G10L17/22 ; G10L17/04 ; G10L17/02 ; G10L17/06
摘要:
本发明涉及人工智能领域,公开了一种单声道的语音数据的角色识别方法及装置。方法包括:对语音数据进行语音识别,以得到语音数据的录音信息和录音时长;其中,录音时长记录录音信息的时间长度;基于通用背景模型从录音信息中提取说话人的声音特征;根据录音时长确定对所述说话人的角色判断阈值;将说话人的声音特征与预存储的目标角色的声音特征进行相似度比对,以获得相似度比对结果;根据相似度比对结果与角色判断阈值之间的关系确定语音数据中的说话人是否为所述目标角色。本技术方案解决现有技术不适用实时的说话人识别、对于时长较短的录音识别正确率较低、对于角色识别没有纠错机制的问题。
公开/授权文献
- CN109785846A 单声道的语音数据的角色识别方法及装置 公开/授权日:2019-05-21