-
公开(公告)号:CN118656434A
公开(公告)日:2024-09-17
申请号:CN202410791744.3
申请日:2024-06-18
申请人: 北京航空航天大学杭州创新研究院 , 杭州齐芯智光科技有限责任公司
摘要: 本发明涉及一种用于大模型精准检索的输入信息的获取方法及系统,包括:对当前用户的提问信息进行向量化处理,获取第一向量及关键词集合一;基于提问信息,在向量数据库中进行检索,获得与第一向量匹配的所有向量结果,针对每一向量结果得到一个关键词集合二;删除关键词集合二中与关键词集合一存在相同关键词的信息,得到关键词集合三;对关键词集合三进行处理,获取第二向量,将第一向量与第二向量进行点积运算,获得每一个文档的注意力权重;基于每一个文档的注意力权重,获取在预设范围内的文档;将在预设范围内的文档与提问信息组合输入预先给定的提示词模型,获得用于输入精准检索的大模型的输入信息。本发明能够提高大模型检索精确率。