一种跨语言稠密检索中的查询表示增强方法

    公开(公告)号:CN116204622A

    公开(公告)日:2023-06-02

    申请号:CN202310157691.5

    申请日:2023-02-23

    Applicant: 南京大学

    Abstract: 本发明提出了一种跨语言稠密检索中的查询表示增强方法,包括:从跨语言检索系统的搜索日志中,收集用户输入的源语言查询以及对应的查询结果即目标语言候选文档中用户点击的目标语言文档,构建有标注的数据;检索出与用户输入的源语言查询相似度分数最高的前K个查询,将检索出的前K个查询分别对应的K个相关文档作为反馈文档;训练跨语言稠密检索模型,并根据K个反馈文档和用户输入的源语言查询获得稠密表示向量并进行融合,得到增强后的源语言查询表示;计算得到查询与文档的相似度;对目标语言候选文档进行排序,输出排序后的结果作为最终的检索结果。

Patent Agency Ranking