-
公开(公告)号:CN118210878B
公开(公告)日:2024-07-23
申请号:CN202410619811.3
申请日:2024-05-17
申请人: 清华大学
IPC分类号: G06F16/33 , G06F16/332 , G06F16/36 , G06F40/253 , G06F40/284
摘要: 本发明公开了一种多跳问答方法及装置,涉及多跳问答技术领域,获取用户输入的问题数据,基于上下文感知算法,从问题数据中确定反映问题意图的查询数据,采用动态知识图谱选择算法,从知识图谱池中选择与查询数据相关性最高的目标知识图谱,对目标知识图谱采用自适应三元组提纯算法进行处理得到三元组集,将三元组集和问题数据一同输入到多跳问答模型中进行处理,生成最终的答案。本发明采用上下文感知算法生成能够反映问题真正意图的查询数据,通过动态知识图谱选择算法选择目标知识图谱提高检索灵活性,通过自适应三元组提纯算法对目标知识图谱进行提纯,确保后续提供给多跳问答模型的信息是与问题数据最相关和最精准的,从而可准确回答问题。
-
公开(公告)号:CN118364119A
公开(公告)日:2024-07-19
申请号:CN202410508581.3
申请日:2024-04-25
申请人: 清华大学
IPC分类号: G06F16/36 , G06F16/335 , G06F40/295 , G06F40/216
摘要: 本发明公开了一种知识图谱的检索方法及装置,获取用户输入的文本类查询问题,基于情境感知实体识别技术确定文本类查询问题对应的文本向量,以及文本类查询问题中每个单词和短语与文本类查询问题整体之间的关系,得到文本类查询问题的关键实体,在知识图谱中基于关键实体构建情境感知子图,并基于文本向量确定综合向量,利用综合向量在知识图谱中进行检索得到目标检索结果。本发明在进行知识图谱检索时,采用情境感知实体识别技术确定文本类查询问题中每个单词和短语与文本类查询问题整体之间的关系,从而充分考虑整个文本类查询问题的上下文,准确地识别用户的真实意图,提供更加准确的检索结果。
-
公开(公告)号:CN118568227A
公开(公告)日:2024-08-30
申请号:CN202410693073.7
申请日:2024-05-30
申请人: 清华大学
IPC分类号: G06F16/332 , G06F16/35 , G06F16/38 , G06F40/284 , G06N3/0495 , G06N3/06 , G06N3/082 , G06N3/084
摘要: 本公开涉及人工智能技术领域,尤其涉及一种人机协同的主题分类搜索模式方法、装置及存储介质,所述方法包括:从输入的查询文本中提取特征向量,特征向量包括多个输入特征;根据特征向量,对预设的稀疏化模型进行调整得到调整后的稀疏化模型,调整包括对稀疏化模型的权重矩阵进行剪枝处理,权重矩阵包括多个权重,权重用于指示对应的输入特征对稀疏化模型的输出结果的贡献程度;根据特征向量,通过调整后的稀疏化模型输出得到对应的主题分类搜索结果。本公开实施例通过根据查询文本的特征向量,动态调整和优化稀疏化模型,其中涉及到对权重矩阵的动态地剪枝处理,从而采用调整后的稀疏化模型输出搜索结果,以确保搜索结果的相关性和精确性。
-
公开(公告)号:CN118210878A
公开(公告)日:2024-06-18
申请号:CN202410619811.3
申请日:2024-05-17
申请人: 清华大学
IPC分类号: G06F16/33 , G06F16/332 , G06F16/36 , G06F40/253 , G06F40/284
摘要: 本发明公开了一种多跳问答方法及装置,涉及多跳问答技术领域,获取用户输入的问题数据,基于上下文感知算法,从问题数据中确定反映问题意图的查询数据,采用动态知识图谱选择算法,从知识图谱池中选择与查询数据相关性最高的目标知识图谱,对目标知识图谱采用自适应三元组提纯算法进行处理得到三元组集,将三元组集和问题数据一同输入到多跳问答模型中进行处理,生成最终的答案。本发明采用上下文感知算法生成能够反映问题真正意图的查询数据,通过动态知识图谱选择算法选择目标知识图谱提高检索灵活性,通过自适应三元组提纯算法对目标知识图谱进行提纯,确保后续提供给多跳问答模型的信息是与问题数据最相关和最精准的,从而可准确回答问题。
-
-
-