一种SQL语句生成方法及相关装置
    1.
    发明公开

    公开(公告)号:CN118535591A

    公开(公告)日:2024-08-23

    申请号:CN202411006589.6

    申请日:2024-07-25

    IPC分类号: G06F16/242 G06F16/22 G06N3/09

    摘要: 本申请公开了一种SQL语句生成方法及相关装置,涉及自然语言处理领域,包括:预先利用Text‑to‑SQL数据集对开源的大语言模型进行训练得到Text‑to‑SQL模型,在获取待处理的问句以及数据库表结构信息之后,先从Text‑to‑SQL数据集中确定与该问句相似的Text‑to‑SQL数据作为Text‑to‑SQL目标样例,再将问句、数据库表结构信息以及Text‑to‑SQL目标样例输入Text‑to‑SQL模型,得到模型生成的SQL语句,作为问句对应的SQL语句,该方案利用了大语言模型的超强能力,还为大语言模型提供了更具参考性的Text‑to‑SQL目标样例,能够提升SQL语句生成的准确性。

    问题回答方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114547273B

    公开(公告)日:2022-08-16

    申请号:CN202210271016.0

    申请日:2022-03-18

    摘要: 本申请公开了一种问题回答方法及相关装置、电子设备、存储介质,其中,问题回答方法包括:获取问题文本和知识图谱;基于各个片段的片段特征表示分别与候选实体的第一特征表示进行交互,得到问题文本映射于目标空间的第二特征表示;基于第一特征表示和第二特征表示,得到问题文本与候选实体在目标空间的特征相似度;基于各个候选实体分别与问题文本之间的特征相似度,选择至少一个候选实体作为问题文本的答案文本。上述方案,能够更加准确地体现问题文本与候选实体之间的关联性,并大大减少由于问题文本和候选实体两者特征空间不同而带来的差异,能够提升问题回答的准确性。

    实体对齐方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115062783B

    公开(公告)日:2023-04-07

    申请号:CN202210944830.4

    申请日:2022-08-08

    IPC分类号: G06N5/02 G06V30/40 G06V30/19

    摘要: 本申请公开了一种实体对齐方法及相关装置、电子设备、存储介质,其中,实体对齐方法包括:获取待对齐的第一多模态知识图谱和第二多模态知识图谱;提取第一多模态知识图谱各种模态的第一子图谱,并提取第二多模态知识图谱各种模态的第二子图谱,及基于相同模态的第一子图谱和第二子图谱进行实体对齐,得到实体集合;获取在第一多模态知识图谱且不在实体集合的第一实体,获取在第二多模态知识图谱且不在实体集合的第二实体;获取第一实体和第二实体之间的特征相似度,并获取第一实体的图文匹配度和第二实体的图文匹配度;基于特征相似度和图文匹配度,得到第一实体和第二实体的实体对齐结果。上述方案,能够提升多模态知识图谱中实体对齐的准确性。

    实体对齐方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115062783A

    公开(公告)日:2022-09-16

    申请号:CN202210944830.4

    申请日:2022-08-08

    IPC分类号: G06N5/02 G06V30/40 G06V30/19

    摘要: 本申请公开了一种实体对齐方法及相关装置、电子设备、存储介质,其中,实体对齐方法包括:获取待对齐的第一多模态知识图谱和第二多模态知识图谱;提取第一多模态知识图谱各种模态的第一子图谱,并提取第二多模态知识图谱各种模态的第二子图谱,及基于相同模态的第一子图谱和第二子图谱进行实体对齐,得到实体集合;获取在第一多模态知识图谱且不在实体集合的第一实体,获取在第二多模态知识图谱且不在实体集合的第二实体;获取第一实体和第二实体之间的特征相似度,并获取第一实体的图文匹配度和第二实体的图文匹配度;基于特征相似度和图文匹配度,得到第一实体和第二实体的实体对齐结果。上述方案,能够提升多模态知识图谱中实体对齐的准确性。

    问题回答方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114547273A

    公开(公告)日:2022-05-27

    申请号:CN202210271016.0

    申请日:2022-03-18

    摘要: 本申请公开了一种问题回答方法及相关装置、电子设备、存储介质,其中,问题回答方法包括:获取问题文本和知识图谱;基于各个片段的片段特征表示分别与候选实体的第一特征表示进行交互,得到问题文本映射于目标空间的第二特征表示;基于第一特征表示和第二特征表示,得到问题文本与候选实体在目标空间的特征相似度;基于各个候选实体分别与问题文本之间的特征相似度,选择至少一个候选实体作为问题文本的答案文本。上述方案,能够更加准确地体现问题文本与候选实体之间的关联性,并大大减少由于问题文本和候选实体两者特征空间不同而带来的差异,能够提升问题回答的准确性。

    一种自然语言到SQL语句的转换方法及相关装置

    公开(公告)号:CN118331996B

    公开(公告)日:2024-11-05

    申请号:CN202410770741.1

    申请日:2024-06-14

    IPC分类号: G06F16/242 G06F40/20

    摘要: 本申请公开了一种自然语言到SQL语句的转换方法及相关装置,涉及自然语言处理及数据库查询技术领域,其中,方法包括:当获得用户的第一自然查询语句时,结合数据库中的数据表分析第一自然查询语句是否存在歧义和/或涉及不可查字段;若第一自然查询语句不存在歧义且不涉及不可查字段,则根据第一自然查询语句生成可执行SQL语句;若第一自然查询语句存在歧义和/或涉及不可查字段,则向用户发出澄清请求;当获得用户针对澄清请求重新提出的第二自然查询语句时,根据第二自然查询语句生成可执行SQL语句。基于本申请公开的自然语言到SQL语句的转换方法可获得符合用户要求的SQL语句。

    一种自然语言到SQL语句的转换方法及相关装置

    公开(公告)号:CN118331996A

    公开(公告)日:2024-07-12

    申请号:CN202410770741.1

    申请日:2024-06-14

    IPC分类号: G06F16/242 G06F40/20

    摘要: 本申请公开了一种自然语言到SQL语句的转换方法及相关装置,涉及自然语言处理及数据库查询技术领域,其中,方法包括:当获得用户的第一自然查询语句时,结合数据库中的数据表分析第一自然查询语句是否存在歧义和/或涉及不可查字段;若第一自然查询语句不存在歧义且不涉及不可查字段,则根据第一自然查询语句生成可执行SQL语句;若第一自然查询语句存在歧义和/或涉及不可查字段,则向用户发出澄清请求;当获得用户针对澄清请求重新提出的第二自然查询语句时,根据第二自然查询语句生成可执行SQL语句。基于本申请公开的自然语言到SQL语句的转换方法可获得符合用户要求的SQL语句。

    地址文本的匹配方法、装置、电子设备和存储介质

    公开(公告)号:CN115563979A

    公开(公告)日:2023-01-03

    申请号:CN202211193407.1

    申请日:2022-09-28

    摘要: 本申请提出一种地址文本的匹配方法、装置、电子设备和存储介质,地址文本的匹配方法包括对第一地址文本和第二地址文本进行地址要素识别,得到第一地址文本的地址要素和第二地址文本的地址要素;根据第一地址文本的地址要素和第二地址文本的地址要素,对第一地址文本和第二地址文本进行地址类型分类处理,确定第一地址文本的地址类型和第二地址文本的地址类型;地址类型分类处理为将地址文本分类为预设的多种地址类型中的一种;至少基于第一地址文本、第一地址文本的地址类型、第二地址文本,以及第二地址文本的地址类型,确定第一地址文本和第二地址文本的匹配度。通过上述方案,能够提高地址文本的匹配准确度。