文档检索方法、装置、电子设备及存储介质

    公开(公告)号:CN117520632A

    公开(公告)日:2024-02-06

    申请号:CN202311524444.0

    申请日:2023-11-15

    摘要: 本申请提供一种文档检索方法、装置、电子设备及存储介质,涉及计算机技术领域,用于构建以文档相似度为边,文档为结点的图结构,并在图结构的基础上通过迭代算法计算文档在文档集中的重要程度。该方法包括:获取搜索词对应的初始检索结果;基于搜索词,对各搜索文档进行命名实体识别,根据各搜索文档对应的实体词,构建实体词集合,并确定各搜索文档对应的实体词频次向量;基于实体词频次向量,确定任意两个搜索文档之间的相似度;以各搜索文档作为结点,以搜索文档之间的相似度作为边,构建初始检索结果对应的图结构;基于预设的迭代算法,确定图结构中各结点的重要程度,并根据重要程度的高低,对各搜索文档进行排序,得到目标搜索结果。