- 专利标题: 一种基于说话人向量复用的语音识别系统及方法
-
申请号: CN202011312979.8申请日: 2020-11-20
-
公开(公告)号: CN112420054B公开(公告)日: 2022-07-12
- 发明人: 秦艳姣
- 申请人: 湖北第二师范学院
- 申请人地址: 湖北省武汉市东湖新技术开发区高新二路129号
- 专利权人: 湖北第二师范学院
- 当前专利权人: 湖北第二师范学院
- 当前专利权人地址: 湖北省武汉市东湖新技术开发区高新二路129号
- 代理机构: 武汉知产时代知识产权代理有限公司
- 代理商 马帅
- 主分类号: G10L15/30
- IPC分类号: G10L15/30 ; G10L15/02
摘要:
本发明提供一种基于说话人向量复用的语音识别系统,包括终端设备、说话人向量提取器、说话向量云缓存器、云端语音识别服务器和语音识别引擎,终端设备、说话人向量提取器、说话向量云缓存器和语音识别引擎分别与云端语音识别服务器连接。本发明的有益效果:本发明通过对说话人向量进行复用,并在语音识别引擎识别前通过云端语音识别服务器对终端说话人向量和云端说话人向量进行融合,从而提高语音识别引擎识别率,解决因提取的说话人向量的精度不高导致语音开始部分的识别率不高的问题。
公开/授权文献
- CN112420054A 一种基于说话人向量复用的语音识别系统及方法 公开/授权日:2021-02-26