-
公开(公告)号:CN114462359B
公开(公告)日:2024-07-26
申请号:CN202111655993.2
申请日:2021-12-30
申请人: 科大讯飞(苏州)科技有限公司 , 合肥量圳建筑科技有限公司
IPC分类号: G06F40/151 , G06F40/205 , G06F40/30 , G06N3/0455 , G06N3/082
摘要: 本发明提供一种逻辑语句生成方法、装置、电子设备及存储介质,首先获取自然语言文本,并抽取自然语言文本的各三元组;各三元组均包括主语、谓语以及宾语中至少一个元素,各三元组中各元素均基于自然语言文本确定;然后对各三元组进行序列标注,确定各三元组之间的逻辑信息;最后基于各三元组以及逻辑信息,确定自然语言文本对应的逻辑语句。该方法可以自动生成自然语言文本对应的逻辑语句,整个过程不需要人工介入,可以降低生成逻辑语句的人力成本,缩短生成逻辑语句所需的时长。而且,该方法同样适用于对更新后的自然语言文本。此外,生成的逻辑语句可以应用于知识图谱的构建,便于开展大量下游实际应用任务。
-
公开(公告)号:CN110619051B
公开(公告)日:2023-08-04
申请号:CN201910759198.4
申请日:2019-08-16
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/36 , G06F16/35 , G06F16/332 , G06F40/30 , G06F40/295
摘要: 本申请提供了一种问题语句分类方法、装置、电子设备及计算机存储介质,通过接收待分类的问题语句;确定所述问题语句的分类特征,所述分类特征用于表示所述问题语句的语义和关联知识,所述关联知识为语义中被提问对象对应的关联知识;根据所述分类特征确定所述问题语句的类别。可以自动对问题语句进行标注,在提高工作效率的同时大大节省了人力成本。
-
公开(公告)号:CN116306566A
公开(公告)日:2023-06-23
申请号:CN202211098485.3
申请日:2022-09-08
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F40/205
摘要: 本申请公开了一种表格解析方法、装置、设备和存储介质,该方法包括:获取待解析的目标表格;确定目标表格中包含的若干表头单元格和若干数据单元格;基于若干表头单元格中的文本信息,得到各表头单元格间的层级关系;基于各表头单元格间的层级关系,得到若干数据单元格和至少一个表头单元格间的对应结果。通过上述方式,本申请能够实现对各种表格的解析,适用性和泛化能力强。
-
公开(公告)号:CN115774792A
公开(公告)日:2023-03-10
申请号:CN202310106687.6
申请日:2023-02-13
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/36 , G06F40/205 , G06F40/30 , G06N5/025 , G06F18/25
摘要: 本申请公开了一种篇章处理方法及相关装置、电子设备、存储介质,该方法包括:获取待处理篇章和关系集合;基于待处理篇章进行编码,得到实体对的第一编码特征和待处理篇章中句子的第二编码特征;基于实体对的第一编码特征和句子的第二编码特征,预测得到句子作为确定实体对之间实体关系的证据句的置信度;基于各个句子分别作为实体对的证据句的置信度,在待处理篇章中为实体对选择作为证据句的句子;基于待处理篇章和实体对的证据句,选择作为实体对之间实体关系的预设关系,得到实体对的第一关系抽取结果。通过上述方式,能够提高实体关系抽取的准确性。
-
公开(公告)号:CN115168619B
公开(公告)日:2022-12-27
申请号:CN202211085634.2
申请日:2022-09-06
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/36 , G06F40/295
摘要: 本申请涉及人工智能技术领域,公开了一种实体关系抽取方法及相关装置、电子设备、存储介质,其中,实体关系抽取方法包括:识别待处理文本中的各个实体;基于各个实体进行预测,得到若干候选关系;其中,候选关系表征各个实体之间疑似存在的实体关系;基于各个实体和若干候选关系,生成得到若干假设文本;其中,假设文本表征假设两个实体之间真实存在候选关系的自然语言文本;基于假设文本的推理结果,确定假设文本中两个实体之间是否真实存在候选关系。上述方案,能够降低实体关系抽取的计算量,特别是在存在关系嵌套时尽可能地减少冗余计算。
-
公开(公告)号:CN115422353A
公开(公告)日:2022-12-02
申请号:CN202210903213.X
申请日:2022-07-29
申请人: 科大讯飞(苏州)科技有限公司
摘要: 本发明提供了一种基于二分类和要素知识模型融合的事件标签检测方法,该方法包括:对事件文本与对应标签进行拼接,得到整体向量表征;将整体向量表征经相符性判断模块,判断事件文本与事件标签的关联度,得到第二标签检测结果;基于要素知识的事件标签检测模型,对事件文本进行标签检测,得到第一标签检测结果;通过网格搜索,对第一标签检测结果和第二标签检测结果进行融合,得到事件的最终标签检测结果。
-
公开(公告)号:CN115270754A
公开(公告)日:2022-11-01
申请号:CN202211138842.4
申请日:2022-09-19
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F40/194 , G06F40/295 , G06F16/36 , G06F16/583 , G06V30/19 , G06V30/41
摘要: 本申请公开了一种跨模态匹配方法及相关装置、电子设备、存储介质,其中,跨模态匹配方法包括:获取待匹配文本和待匹配图像;获取任一对待匹配文本和待匹配图像之间的匹配分值;基于任一对待匹配文本和待匹配图像之间的匹配分值,确定相互匹配的待匹配文本和待匹配图像,作为匹配图文对;其中,匹配分值基于跨模态匹配模型对待匹配文本和待匹配图像匹配分析得到,跨模态匹配模型基于样本数据训练得到,样本数据包括样本图像、与样本图像匹配的样本正例文本和与样本图像不匹配的样本负例文本,且样本负例文本基于知识图谱对样本正例文本进行改造得到。上述方案,能够提升跨模态匹配的匹配精度。
-
公开(公告)号:CN114610903A
公开(公告)日:2022-06-10
申请号:CN202210317850.9
申请日:2022-03-29
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/36 , G06F40/30 , G06F40/242 , G06F40/274 , G06N3/04 , G06N3/08
摘要: 本申请公开了一种文本关系抽取方法、装置、设备以及存储介质,该方法包括:获取目标文本;利用预训练的编码器对目标文件进行编码处理,得到目标文本的编码特征;基于所述编码特征,利用句内关系抽取模型获得所述目标文本的每个句子中的第一实体关系信息,并利用全文关系抽取模型获得所述目标文本包含的第二实体关系信息。通过上述方式,本申请能够提高文本关系抽取的准确率。
-
公开(公告)号:CN114266238A
公开(公告)日:2022-04-01
申请号:CN202111530417.5
申请日:2021-12-14
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F40/205 , G06F40/284 , G06F16/35 , G06F16/31
摘要: 本发明提供一种文本要素提取方法、装置、电子设备及存储介质,其中方法包括:确定待识别文本;对所述待识别文本中的每个子句进行要素粒度分类,得到所述每个子句的要素粒度类型,所述要素粒度类型为句粒度或词粒度;基于所述每个子句的要素粒度类型,对所述待识别文本进行要素提取,得到目标要素文本。本发明提供的方法、装置、电子设备及存储介质,能够通过对待识别文本中的每个子句进行词粒度和句粒度的分类,每个子句通过其对应的粒度类型进行要素提取,得到目标要素文本,实现了基于使用词粒度结合句粒度对文本进行非连续要素提取,在保证识别准确率的同时,还提高了识别的时效性,进而提高了要素提取的准确率和时效性。
-
公开(公告)号:CN114238550A
公开(公告)日:2022-03-25
申请号:CN202111538301.6
申请日:2021-12-15
申请人: 科大讯飞(苏州)科技有限公司
IPC分类号: G06F16/31 , G06F40/126 , G06F40/284 , G06F40/30 , G06F16/903
摘要: 本发明提供一种要素抽取方法、装置、电子设备和存储介质,其中方法包括:获取待抽取文本,以及待抽取文本的词汇集合;基于待抽取文本中每两个字符对应的字符串与词汇集合间的匹配结果,确定每两个字符间的相关度,字符串以对应两个字符为起终点在待抽取文本中截取得到;基于每两个字符间的相关度,对待抽取文本中的各字符进行编码,得到各字符的要素边界特征;基于各字符的要素边界特征,确定待抽取文本的要素抽取结果。本发明提供的要素抽取方法、装置、电子设备和存储介质,不需要将匹配到的词汇与原始句子进行拼接,不会改变原有的输入长度,从而提高了编码效率。此外,相较于现有词汇拼接的方法,节约了存储空间。
-
-
-
-
-
-
-
-
-