一种SQL语句生成方法及相关装置
    1.
    发明公开

    公开(公告)号:CN118535591A

    公开(公告)日:2024-08-23

    申请号:CN202411006589.6

    申请日:2024-07-25

    IPC分类号: G06F16/242 G06F16/22 G06N3/09

    摘要: 本申请公开了一种SQL语句生成方法及相关装置,涉及自然语言处理领域,包括:预先利用Text‑to‑SQL数据集对开源的大语言模型进行训练得到Text‑to‑SQL模型,在获取待处理的问句以及数据库表结构信息之后,先从Text‑to‑SQL数据集中确定与该问句相似的Text‑to‑SQL数据作为Text‑to‑SQL目标样例,再将问句、数据库表结构信息以及Text‑to‑SQL目标样例输入Text‑to‑SQL模型,得到模型生成的SQL语句,作为问句对应的SQL语句,该方案利用了大语言模型的超强能力,还为大语言模型提供了更具参考性的Text‑to‑SQL目标样例,能够提升SQL语句生成的准确性。

    一种关系抽取方法、装置、设备及可读存储介质

    公开(公告)号:CN117808091A

    公开(公告)日:2024-04-02

    申请号:CN202311851383.9

    申请日:2023-12-29

    摘要: 本申请公开了一种关系抽取方法、装置、设备及可读存储介质,涉及数据处理技术领域,该方法包括:获取目标实体对和待抽取文本;将目标实体对和待抽取文本输入关系抽取模型中,得到目标实体对的关系,关系抽取模型是基于半监督学习的方式训练得到的,关系抽取模型的训练数据集包括标注数据和未标注数据,标注数据为对应的标签的真实概率大于或等于预设阈值的训练数据,未标注数据为对应的标签的真实概率小于预设阈值的训练数据。可见,本申请中的关系抽取模型在训练时可以将训练数据区分为标注数据和未标注数据,也即在训练时可以避免训练数据中的噪声数据的干扰,提高了训练出的关系抽取模型在进行关系抽取的准确性,从而提高了关系抽取的准确度。

    问题回答方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114547273B

    公开(公告)日:2022-08-16

    申请号:CN202210271016.0

    申请日:2022-03-18

    摘要: 本申请公开了一种问题回答方法及相关装置、电子设备、存储介质,其中,问题回答方法包括:获取问题文本和知识图谱;基于各个片段的片段特征表示分别与候选实体的第一特征表示进行交互,得到问题文本映射于目标空间的第二特征表示;基于第一特征表示和第二特征表示,得到问题文本与候选实体在目标空间的特征相似度;基于各个候选实体分别与问题文本之间的特征相似度,选择至少一个候选实体作为问题文本的答案文本。上述方案,能够更加准确地体现问题文本与候选实体之间的关联性,并大大减少由于问题文本和候选实体两者特征空间不同而带来的差异,能够提升问题回答的准确性。

    文本要素提取方法、装置、电子设备及存储介质

    公开(公告)号:CN114266238A

    公开(公告)日:2022-04-01

    申请号:CN202111530417.5

    申请日:2021-12-14

    摘要: 本发明提供一种文本要素提取方法、装置、电子设备及存储介质,其中方法包括:确定待识别文本;对所述待识别文本中的每个子句进行要素粒度分类,得到所述每个子句的要素粒度类型,所述要素粒度类型为句粒度或词粒度;基于所述每个子句的要素粒度类型,对所述待识别文本进行要素提取,得到目标要素文本。本发明提供的方法、装置、电子设备及存储介质,能够通过对待识别文本中的每个子句进行词粒度和句粒度的分类,每个子句通过其对应的粒度类型进行要素提取,得到目标要素文本,实现了基于使用词粒度结合句粒度对文本进行非连续要素提取,在保证识别准确率的同时,还提高了识别的时效性,进而提高了要素提取的准确率和时效性。

    要素抽取方法、装置、电子设备和存储介质

    公开(公告)号:CN114238550A

    公开(公告)日:2022-03-25

    申请号:CN202111538301.6

    申请日:2021-12-15

    摘要: 本发明提供一种要素抽取方法、装置、电子设备和存储介质,其中方法包括:获取待抽取文本,以及待抽取文本的词汇集合;基于待抽取文本中每两个字符对应的字符串与词汇集合间的匹配结果,确定每两个字符间的相关度,字符串以对应两个字符为起终点在待抽取文本中截取得到;基于每两个字符间的相关度,对待抽取文本中的各字符进行编码,得到各字符的要素边界特征;基于各字符的要素边界特征,确定待抽取文本的要素抽取结果。本发明提供的要素抽取方法、装置、电子设备和存储介质,不需要将匹配到的词汇与原始句子进行拼接,不会改变原有的输入长度,从而提高了编码效率。此外,相较于现有词汇拼接的方法,节约了存储空间。

    一种人岗匹配智能推荐方法、系统及装置

    公开(公告)号:CN118152553B

    公开(公告)日:2024-08-20

    申请号:CN202410578825.5

    申请日:2024-05-11

    摘要: 本发明涉及一种人岗匹配智能推荐方法、系统及装置,该方法包括:收集求职者和招聘岗位的相关数据并进行清洗、分类和整理;对整理后的求职者和招聘岗位的文本数据进行预处理,构建孪生网络模型,利用预处理后的文本数据对所述孪生网络模型进行训练,得到训练后的孪生网络模型;基于训练后的孪生网络模型,计算得到求职者和岗位的特征向量的总相似度;基于求职者和岗位的特征向量的总相似度构建人岗匹配函数,根据所述人岗匹配函数得到人岗匹配分数,将所述人岗匹配分数按照大小进行排序,选取排名前N个岗位作为推荐结果推荐给求职者。本发明实现了对求职者和招聘岗位之间的精准匹配和高效推荐,具有重要的实际应用价值和意义。

    一种知识图谱的实体对齐方法、装置、存储介质及设备

    公开(公告)号:CN117744778A

    公开(公告)日:2024-03-22

    申请号:CN202311825351.1

    申请日:2023-12-27

    摘要: 本申请公开了一种知识图谱的实体对齐方法、装置、存储介质及设备,该方法包括:首先根据第一知识图谱中第一知识点实体和第二知识图谱中第二知识点实体的关键词相似度,从第二知识点实体中筛选出第一知识点实体对应的候选知识点实体,然后计算第一知识点实体与候选知识点实体的文本特征向量相似度,并将高于第一相似度阈值的相似度对应的候选知识点实体与第一知识点实体构成第一对齐实体对;接着根据第一知识点实体和候选知识点实体的图特征向量,通过拉近第一对齐实体对中实体之间的距离,获取第二对齐实体对;再将剩下的候选知识点实体与第一知识点实体输入实体对齐分类模型,预测二者是否为具有包含关系的对齐实体对,以提高对齐结果的准确性。