-
公开(公告)号:CN118535591A
公开(公告)日:2024-08-23
申请号:CN202411006589.6
申请日:2024-07-25
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/242 , G06F16/22 , G06N3/09
摘要: 本申请公开了一种SQL语句生成方法及相关装置,涉及自然语言处理领域,包括:预先利用Text‑to‑SQL数据集对开源的大语言模型进行训练得到Text‑to‑SQL模型,在获取待处理的问句以及数据库表结构信息之后,先从Text‑to‑SQL数据集中确定与该问句相似的Text‑to‑SQL数据作为Text‑to‑SQL目标样例,再将问句、数据库表结构信息以及Text‑to‑SQL目标样例输入Text‑to‑SQL模型,得到模型生成的SQL语句,作为问句对应的SQL语句,该方案利用了大语言模型的超强能力,还为大语言模型提供了更具参考性的Text‑to‑SQL目标样例,能够提升SQL语句生成的准确性。
-
公开(公告)号:CN117808091A
公开(公告)日:2024-04-02
申请号:CN202311851383.9
申请日:2023-12-29
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06N5/025 , G06F18/214 , G06F18/24 , G06F40/279
摘要: 本申请公开了一种关系抽取方法、装置、设备及可读存储介质,涉及数据处理技术领域,该方法包括:获取目标实体对和待抽取文本;将目标实体对和待抽取文本输入关系抽取模型中,得到目标实体对的关系,关系抽取模型是基于半监督学习的方式训练得到的,关系抽取模型的训练数据集包括标注数据和未标注数据,标注数据为对应的标签的真实概率大于或等于预设阈值的训练数据,未标注数据为对应的标签的真实概率小于预设阈值的训练数据。可见,本申请中的关系抽取模型在训练时可以将训练数据区分为标注数据和未标注数据,也即在训练时可以避免训练数据中的噪声数据的干扰,提高了训练出的关系抽取模型在进行关系抽取的准确性,从而提高了关系抽取的准确度。
-
公开(公告)号:CN117453829A
公开(公告)日:2024-01-26
申请号:CN202311748220.8
申请日:2023-12-19
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/27 , G06F16/22 , G06F16/36 , G06F40/186
摘要: 本发明提供了一种知识图谱数据同步方法和计算机,该方法包括:预先创建知识图谱框架和与该框架对应的待填写模板数据表;按照待填写模板数据表,收集所述模板数据表所需的数据;利用数据同步模块,根据模板数据表与知识图谱框架之间的对应关系,基于模板数据表中的数据,向基于知识图谱框架创建的知识图谱中同步实体和关系数据。
-
公开(公告)号:CN114547273B
公开(公告)日:2022-08-16
申请号:CN202210271016.0
申请日:2022-03-18
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/332 , G06F16/36 , G06F40/194
摘要: 本申请公开了一种问题回答方法及相关装置、电子设备、存储介质,其中,问题回答方法包括:获取问题文本和知识图谱;基于各个片段的片段特征表示分别与候选实体的第一特征表示进行交互,得到问题文本映射于目标空间的第二特征表示;基于第一特征表示和第二特征表示,得到问题文本与候选实体在目标空间的特征相似度;基于各个候选实体分别与问题文本之间的特征相似度,选择至少一个候选实体作为问题文本的答案文本。上述方案,能够更加准确地体现问题文本与候选实体之间的关联性,并大大减少由于问题文本和候选实体两者特征空间不同而带来的差异,能够提升问题回答的准确性。
-
公开(公告)号:CN115422353A
公开(公告)日:2022-12-02
申请号:CN202210903213.X
申请日:2022-07-29
申请人: 科大讯飞(苏州)科技有限公司
摘要: 本发明提供了一种基于二分类和要素知识模型融合的事件标签检测方法,该方法包括:对事件文本与对应标签进行拼接,得到整体向量表征;将整体向量表征经相符性判断模块,判断事件文本与事件标签的关联度,得到第二标签检测结果;基于要素知识的事件标签检测模型,对事件文本进行标签检测,得到第一标签检测结果;通过网格搜索,对第一标签检测结果和第二标签检测结果进行融合,得到事件的最终标签检测结果。
-
公开(公告)号:CN114266238A
公开(公告)日:2022-04-01
申请号:CN202111530417.5
申请日:2021-12-14
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F40/205 , G06F40/284 , G06F16/35 , G06F16/31
摘要: 本发明提供一种文本要素提取方法、装置、电子设备及存储介质,其中方法包括:确定待识别文本;对所述待识别文本中的每个子句进行要素粒度分类,得到所述每个子句的要素粒度类型,所述要素粒度类型为句粒度或词粒度;基于所述每个子句的要素粒度类型,对所述待识别文本进行要素提取,得到目标要素文本。本发明提供的方法、装置、电子设备及存储介质,能够通过对待识别文本中的每个子句进行词粒度和句粒度的分类,每个子句通过其对应的粒度类型进行要素提取,得到目标要素文本,实现了基于使用词粒度结合句粒度对文本进行非连续要素提取,在保证识别准确率的同时,还提高了识别的时效性,进而提高了要素提取的准确率和时效性。
-
公开(公告)号:CN114238550A
公开(公告)日:2022-03-25
申请号:CN202111538301.6
申请日:2021-12-15
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/31 , G06F40/126 , G06F40/284 , G06F40/30 , G06F16/903
摘要: 本发明提供一种要素抽取方法、装置、电子设备和存储介质,其中方法包括:获取待抽取文本,以及待抽取文本的词汇集合;基于待抽取文本中每两个字符对应的字符串与词汇集合间的匹配结果,确定每两个字符间的相关度,字符串以对应两个字符为起终点在待抽取文本中截取得到;基于每两个字符间的相关度,对待抽取文本中的各字符进行编码,得到各字符的要素边界特征;基于各字符的要素边界特征,确定待抽取文本的要素抽取结果。本发明提供的要素抽取方法、装置、电子设备和存储介质,不需要将匹配到的词汇与原始句子进行拼接,不会改变原有的输入长度,从而提高了编码效率。此外,相较于现有词汇拼接的方法,节约了存储空间。
-
公开(公告)号:CN118152553B
公开(公告)日:2024-08-20
申请号:CN202410578825.5
申请日:2024-05-11
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/335 , G06F16/9535 , G06N3/0455 , G06N3/08 , G06F40/289 , G06F40/284 , G06Q10/1053
摘要: 本发明涉及一种人岗匹配智能推荐方法、系统及装置,该方法包括:收集求职者和招聘岗位的相关数据并进行清洗、分类和整理;对整理后的求职者和招聘岗位的文本数据进行预处理,构建孪生网络模型,利用预处理后的文本数据对所述孪生网络模型进行训练,得到训练后的孪生网络模型;基于训练后的孪生网络模型,计算得到求职者和岗位的特征向量的总相似度;基于求职者和岗位的特征向量的总相似度构建人岗匹配函数,根据所述人岗匹配函数得到人岗匹配分数,将所述人岗匹配分数按照大小进行排序,选取排名前N个岗位作为推荐结果推荐给求职者。本发明实现了对求职者和招聘岗位之间的精准匹配和高效推荐,具有重要的实际应用价值和意义。
-
公开(公告)号:CN117874333A
公开(公告)日:2024-04-12
申请号:CN202311748366.2
申请日:2023-12-19
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/9535 , G06F16/9538 , G06F16/36 , G06F40/30
摘要: 本发明提供了一种现场处置实时推荐方法和计算机,该方法包括:实时获得现场情况描述的输入信息;根据所述获得的现场情况的输入信息理解搜索意图;基于所述搜索意图,构成目标现场处置操作实体的查询条件,并在现场事件处置的知识图谱中完成查询,得到实时查询结果,所述实时查询结果中包含应尽快采取的至少一个现场处置操作建议。
-
公开(公告)号:CN117744778A
公开(公告)日:2024-03-22
申请号:CN202311825351.1
申请日:2023-12-27
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06N5/022 , G06F16/36 , G06F40/189 , G06F40/289 , G06F40/205 , G06F16/35
摘要: 本申请公开了一种知识图谱的实体对齐方法、装置、存储介质及设备,该方法包括:首先根据第一知识图谱中第一知识点实体和第二知识图谱中第二知识点实体的关键词相似度,从第二知识点实体中筛选出第一知识点实体对应的候选知识点实体,然后计算第一知识点实体与候选知识点实体的文本特征向量相似度,并将高于第一相似度阈值的相似度对应的候选知识点实体与第一知识点实体构成第一对齐实体对;接着根据第一知识点实体和候选知识点实体的图特征向量,通过拉近第一对齐实体对中实体之间的距离,获取第二对齐实体对;再将剩下的候选知识点实体与第一知识点实体输入实体对齐分类模型,预测二者是否为具有包含关系的对齐实体对,以提高对齐结果的准确性。
-
-
-
-
-
-
-
-
-