-
公开(公告)号:CN115455132A
公开(公告)日:2022-12-09
申请号:CN202211145235.0
申请日:2022-09-20
申请人: 中国航天系统科学与工程研究院
IPC分类号: G06F16/31 , G06F16/33 , G06F16/335 , G10L15/02 , G10L15/10 , G10L15/16 , G10L15/32 , G10L25/54
摘要: 本发明提供了一种基于索引融合和伪反馈的语音检索方法,包括以下步骤:由不同语音识别系统对待检索语音文档进行识别生成Lattice;将Lattice转换为混淆网络;基于各系统混淆网络分别建立倒排索引表;利用索引融合对各索引表相同索引项的置信度进行更新,形成新的索引表;接收用户输入的检索关键词进行检索排序,得到初次候选结果集合;利用候选结果与伪相关音频集、伪不相关音频集的声学特征相似度作为伪反馈,重新计算初次候选结果的相关度得分;依据新的相关度得分对检索结果进行重排序,输出满足要求的语音文档。与现有技术相比,本发明能够减少重复检索,提高语音识别结果置信度的可靠性以及检索结果排序准确性。