-
公开(公告)号:CN113609291B
公开(公告)日:2024-11-01
申请号:CN202110860579.9
申请日:2021-07-27
申请人: 科大讯飞(苏州)科技有限公司
摘要: 本发明提供一种实体分类方法、装置、电子设备和存储介质,其中方法包括:确定目标实体及其候选类型;基于目标实体的实体表示和候选类型的类型表示,确定目标实体和候选类型的匹配结果,实体表示是基于对应实体的实体信息和/或实体三元组信息确定的,类型表示是基于对应类型的类型信息和/或类型三元组信息确定的;基于目标实体和候选类型的匹配结果,确定目标实体的实体类型。本发明提供的方法、装置、电子设备和存储介质,实现基于实体和类型的双视角实体分类,其中应用相较于实体的信息更加容易获取和维护的类型信息和/或类型三元组信息,获取信息丰富的类型表示,保证实体分类的可用性,提高实体分类的可靠性和准确性。
-
公开(公告)号:CN118535591A
公开(公告)日:2024-08-23
申请号:CN202411006589.6
申请日:2024-07-25
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/242 , G06F16/22 , G06N3/09
摘要: 本申请公开了一种SQL语句生成方法及相关装置,涉及自然语言处理领域,包括:预先利用Text‑to‑SQL数据集对开源的大语言模型进行训练得到Text‑to‑SQL模型,在获取待处理的问句以及数据库表结构信息之后,先从Text‑to‑SQL数据集中确定与该问句相似的Text‑to‑SQL数据作为Text‑to‑SQL目标样例,再将问句、数据库表结构信息以及Text‑to‑SQL目标样例输入Text‑to‑SQL模型,得到模型生成的SQL语句,作为问句对应的SQL语句,该方案利用了大语言模型的超强能力,还为大语言模型提供了更具参考性的Text‑to‑SQL目标样例,能够提升SQL语句生成的准确性。
-
公开(公告)号:CN117808091A
公开(公告)日:2024-04-02
申请号:CN202311851383.9
申请日:2023-12-29
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06N5/025 , G06F18/214 , G06F18/24 , G06F40/279
摘要: 本申请公开了一种关系抽取方法、装置、设备及可读存储介质,涉及数据处理技术领域,该方法包括:获取目标实体对和待抽取文本;将目标实体对和待抽取文本输入关系抽取模型中,得到目标实体对的关系,关系抽取模型是基于半监督学习的方式训练得到的,关系抽取模型的训练数据集包括标注数据和未标注数据,标注数据为对应的标签的真实概率大于或等于预设阈值的训练数据,未标注数据为对应的标签的真实概率小于预设阈值的训练数据。可见,本申请中的关系抽取模型在训练时可以将训练数据区分为标注数据和未标注数据,也即在训练时可以避免训练数据中的噪声数据的干扰,提高了训练出的关系抽取模型在进行关系抽取的准确性,从而提高了关系抽取的准确度。
-
公开(公告)号:CN111507083B
公开(公告)日:2023-12-12
申请号:CN202010565781.4
申请日:2020-06-19
申请人: 科大讯飞(苏州)科技有限公司 , 讯飞智元信息科技有限公司
IPC分类号: G06F40/205 , G06F40/211 , G06F40/30 , G06F18/2431 , G06N3/0442 , G06N3/08
摘要: 本申请公开了一种文本解析方法、装置、设备及存储介质,本申请获取待解析的目标文本后对其进行解析,从而得到目标文本所包含的各要素,以及由要素组成的至少一个多元组,其中多元组表示对目标文本的信息抽取结果,进而根据各多元组的组成要素,建立具有嵌套关系的多元组数据,作为目标文本的结构化语义表示。本申请方案将目标文本转换为多元组数据这种结构化语义表示,可以很好地将自然语言形式的目标文本,在不丢失语义信息的情况下,让机器能够理解和使用。
-
公开(公告)号:CN114443822B
公开(公告)日:2023-05-26
申请号:CN202111599500.8
申请日:2021-12-24
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/332 , G06F16/36 , G06F16/335
摘要: 公开了用于建筑领域的多模态问答的方法、系统和计算设备,方法包括:基于从用户获取的用户问题和建筑实体图,确定存储的多模态本体树中与所述用户问题相对应的目标实体;以及基于所述用户问题和所述目标实体对存储的规范集中的规范进行筛选,确定与所述用户问题相对应的目标规范。本发明通过图文交互的方式,能够更加准确地获取相关信息,并且基于多层注意力机制,使得能够准确地识别和抽取用户输入的关键信息,从而相应地筛选出用户真正想要的信息返回给用户。
-
公开(公告)号:CN114547273B
公开(公告)日:2022-08-16
申请号:CN202210271016.0
申请日:2022-03-18
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/332 , G06F16/36 , G06F40/194
摘要: 本申请公开了一种问题回答方法及相关装置、电子设备、存储介质,其中,问题回答方法包括:获取问题文本和知识图谱;基于各个片段的片段特征表示分别与候选实体的第一特征表示进行交互,得到问题文本映射于目标空间的第二特征表示;基于第一特征表示和第二特征表示,得到问题文本与候选实体在目标空间的特征相似度;基于各个候选实体分别与问题文本之间的特征相似度,选择至少一个候选实体作为问题文本的答案文本。上述方案,能够更加准确地体现问题文本与候选实体之间的关联性,并大大减少由于问题文本和候选实体两者特征空间不同而带来的差异,能够提升问题回答的准确性。
-
公开(公告)号:CN114462359A
公开(公告)日:2022-05-10
申请号:CN202111655993.2
申请日:2021-12-30
申请人: 科大讯飞(苏州)科技有限公司 , 合肥量圳建筑科技有限公司
IPC分类号: G06F40/151 , G06F40/205 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明提供一种逻辑语句生成方法、装置、电子设备及存储介质,首先获取自然语言文本,并抽取自然语言文本的各三元组;各三元组均包括主语、谓语以及宾语中至少一个元素,各三元组中各元素均基于自然语言文本确定;然后对各三元组进行序列标注,确定各三元组之间的逻辑信息;最后基于各三元组以及逻辑信息,确定自然语言文本对应的逻辑语句。该方法可以自动生成自然语言文本对应的逻辑语句,整个过程不需要人工介入,可以降低生成逻辑语句的人力成本,缩短生成逻辑语句所需的时长。而且,该方法同样适用于对更新后的自然语言文本。此外,生成的逻辑语句可以应用于知识图谱的构建,便于开展大量下游实际应用任务。
-
公开(公告)号:CN114357191A
公开(公告)日:2022-04-15
申请号:CN202111669881.2
申请日:2021-12-31
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/36 , G06F16/35 , G06F16/9535 , G06F40/279
摘要: 本申请公开了一种知识抽取、问答及推荐方法和相关装置、设备、介质。该方法包括:获取时序知识图谱;基于若干三元组分别标注的有效时间进行聚类,得到若干种时间性质的三元组集合;其中,若干种时间性质包括闭区间性质、开区间性质和瞬时性质中的至少一种;对于各种时间性质的三元组集合,获取三元组的特征表示分别在三元组的各个有效超平面上的投影表示;基于三元组分别在各种时间性质的三元组集合所提取得到的投影表示,融合得到三元组的知识表示。通过上述方式,从关系的角度利用三元组的时间性质建模,从而将关系所携带的时间语义信息纳入模型结构中,使得知识表示的事实更加精准。
-
公开(公告)号:CN114328803A
公开(公告)日:2022-04-12
申请号:CN202111601186.2
申请日:2021-12-24
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/31 , G06F16/35 , G06F40/35 , G06F40/289 , G06F40/186 , G06F16/332 , G06F16/33
摘要: 本发明提供一种问答库构建方法、问答方法、装置、电子设备及存储介质,该方法通过对答案文本进行解析,并通过解析得到的第一要素信息以及第一关系信息等得到问题模板,进而实现问答库的构建,可以使答案文本对应有丰富的问题模板,使得问答库的构建更加全面,可以降低用户问题无法在问答库中匹配到对应的问题模板的可能性,可以提高用户体验感。该方法可以在构建问答库时,在已知答案文本的前提下增加答案文本对应的问题模板的数量,可以减少问答库的构建成本,降低问答库的构建难度,也便于问答库的维护。
-
公开(公告)号:CN111414484B
公开(公告)日:2021-05-28
申请号:CN202010144138.4
申请日:2020-03-04
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/36 , G06F16/33 , G06F16/35 , G06F40/211 , G06F40/295 , G06N5/02
摘要: 本发明实施例提供一种有效时段信息确定方法、装置、电子设备和存储介质,其中方法包括:确定事实三元组的提及集中每一语句的语句编码特征和时序编码特征;将每一语句的语句编码特征和时序编码特征输入至关系推理模型,得到关系推理模型输出的每一语句的关系推理结果,关系推理结果用于表征对应语句与事实三元组中的关系的相关程度;基于每一语句的关系推理结果,确定事实三元组的有效时段信息。本发明实施例提供的方法、装置、电子设备和存储介质,全程无需人工介入,适用范围广,有效提高了事实三元组的有效时段信息确定的准确性和可靠性。
-
-
-
-
-
-
-
-
-