发明公开
- 专利标题: 信息检索方法、装置、设备及计算机可读存储介质
-
申请号: CN202010741737.4申请日: 2020-07-29
-
公开(公告)号: CN111753060A公开(公告)日: 2020-10-09
- 发明人: 翟彬旭 , 张雨春 , 翁泽峰 , 张东于 , 范云霓
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 北京派特恩知识产权代理有限公司
- 代理商 刘星雨; 张颖玲
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/35 ; G06F16/31 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本申请实施例提供一种信息检索方法、装置、设备及计算机可读存储介质,其中,方法包括:对接收到的信息检索请求中的待检索信息进行文本分割处理,得到至少两个字段;获取所述待检索信息的特征向量和每一字段的子特征向量;在预设的全量文本空间内,根据所述特征向量对预设文本库中的文本进行第一聚类处理,得到第一数量的候选文本;在预设的子文本空间内,根据所述子特征向量对所述第一数量的候选文本进行第二聚类处理,得到第二数量的召回文本;将所述召回文本作为所述信息检索请求的检索结果,输出所述检索结果。通过本申请实施例,能够根据文本的语义相关度,灵活的度量待检索信息与召回文本之间的相似度,提高信息检索系统的检索准确性。
公开/授权文献
- CN111753060B 信息检索方法、装置、设备及计算机可读存储介质 公开/授权日:2023-09-26