一种基于索引融合和伪反馈的语音检索方法
摘要:
本发明提供了一种基于索引融合和伪反馈的语音检索方法,包括以下步骤:由不同语音识别系统对待检索语音文档进行识别生成Lattice;将Lattice转换为混淆网络;基于各系统混淆网络分别建立倒排索引表;利用索引融合对各索引表相同索引项的置信度进行更新,形成新的索引表;接收用户输入的检索关键词进行检索排序,得到初次候选结果集合;利用候选结果与伪相关音频集、伪不相关音频集的声学特征相似度作为伪反馈,重新计算初次候选结果的相关度得分;依据新的相关度得分对检索结果进行重排序,输出满足要求的语音文档。与现有技术相比,本发明能够减少重复检索,提高语音识别结果置信度的可靠性以及检索结果排序准确性。
0/0