发明公开
- 专利标题: 一种基于索引融合和伪反馈的语音检索方法
-
申请号: CN202211145235.0申请日: 2022-09-20
-
公开(公告)号: CN115455132A公开(公告)日: 2022-12-09
- 发明人: 王叶茵 , 朱盛录 , 周保平 , 邱自成 , 高金梁 , 薛琼 , 邬欢欢 , 吴刚 , 韩天红
- 申请人: 中国航天系统科学与工程研究院
- 申请人地址: 北京市海淀区阜成路16号
- 专利权人: 中国航天系统科学与工程研究院
- 当前专利权人: 中国航天系统科学与工程研究院
- 当前专利权人地址: 北京市海淀区阜成路16号
- 代理机构: 中国航天科技专利中心
- 代理商 陈鹏
- 主分类号: G06F16/31
- IPC分类号: G06F16/31 ; G06F16/33 ; G06F16/335 ; G10L15/02 ; G10L15/10 ; G10L15/16 ; G10L15/32 ; G10L25/54
摘要:
本发明提供了一种基于索引融合和伪反馈的语音检索方法,包括以下步骤:由不同语音识别系统对待检索语音文档进行识别生成Lattice;将Lattice转换为混淆网络;基于各系统混淆网络分别建立倒排索引表;利用索引融合对各索引表相同索引项的置信度进行更新,形成新的索引表;接收用户输入的检索关键词进行检索排序,得到初次候选结果集合;利用候选结果与伪相关音频集、伪不相关音频集的声学特征相似度作为伪反馈,重新计算初次候选结果的相关度得分;依据新的相关度得分对检索结果进行重排序,输出满足要求的语音文档。与现有技术相比,本发明能够减少重复检索,提高语音识别结果置信度的可靠性以及检索结果排序准确性。