逻辑语句生成方法、装置、电子设备及存储介质

    公开(公告)号:CN114462359B

    公开(公告)日:2024-07-26

    申请号:CN202111655993.2

    申请日:2021-12-30

    摘要: 本发明提供一种逻辑语句生成方法、装置、电子设备及存储介质,首先获取自然语言文本,并抽取自然语言文本的各三元组;各三元组均包括主语、谓语以及宾语中至少一个元素,各三元组中各元素均基于自然语言文本确定;然后对各三元组进行序列标注,确定各三元组之间的逻辑信息;最后基于各三元组以及逻辑信息,确定自然语言文本对应的逻辑语句。该方法可以自动生成自然语言文本对应的逻辑语句,整个过程不需要人工介入,可以降低生成逻辑语句的人力成本,缩短生成逻辑语句所需的时长。而且,该方法同样适用于对更新后的自然语言文本。此外,生成的逻辑语句可以应用于知识图谱的构建,便于开展大量下游实际应用任务。

    一种表格解析方法、装置、设备和存储介质

    公开(公告)号:CN116306566A

    公开(公告)日:2023-06-23

    申请号:CN202211098485.3

    申请日:2022-09-08

    IPC分类号: G06F40/205

    摘要: 本申请公开了一种表格解析方法、装置、设备和存储介质,该方法包括:获取待解析的目标表格;确定目标表格中包含的若干表头单元格和若干数据单元格;基于若干表头单元格中的文本信息,得到各表头单元格间的层级关系;基于各表头单元格间的层级关系,得到若干数据单元格和至少一个表头单元格间的对应结果。通过上述方式,本申请能够实现对各种表格的解析,适用性和泛化能力强。

    篇章处理方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115774792A

    公开(公告)日:2023-03-10

    申请号:CN202310106687.6

    申请日:2023-02-13

    摘要: 本申请公开了一种篇章处理方法及相关装置、电子设备、存储介质,该方法包括:获取待处理篇章和关系集合;基于待处理篇章进行编码,得到实体对的第一编码特征和待处理篇章中句子的第二编码特征;基于实体对的第一编码特征和句子的第二编码特征,预测得到句子作为确定实体对之间实体关系的证据句的置信度;基于各个句子分别作为实体对的证据句的置信度,在待处理篇章中为实体对选择作为证据句的句子;基于待处理篇章和实体对的证据句,选择作为实体对之间实体关系的预设关系,得到实体对的第一关系抽取结果。通过上述方式,能够提高实体关系抽取的准确性。

    实体关系抽取方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115168619B

    公开(公告)日:2022-12-27

    申请号:CN202211085634.2

    申请日:2022-09-06

    IPC分类号: G06F16/36 G06F40/295

    摘要: 本申请涉及人工智能技术领域,公开了一种实体关系抽取方法及相关装置、电子设备、存储介质,其中,实体关系抽取方法包括:识别待处理文本中的各个实体;基于各个实体进行预测,得到若干候选关系;其中,候选关系表征各个实体之间疑似存在的实体关系;基于各个实体和若干候选关系,生成得到若干假设文本;其中,假设文本表征假设两个实体之间真实存在候选关系的自然语言文本;基于假设文本的推理结果,确定假设文本中两个实体之间是否真实存在候选关系。上述方案,能够降低实体关系抽取的计算量,特别是在存在关系嵌套时尽可能地减少冗余计算。

    跨模态匹配方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115270754A

    公开(公告)日:2022-11-01

    申请号:CN202211138842.4

    申请日:2022-09-19

    摘要: 本申请公开了一种跨模态匹配方法及相关装置、电子设备、存储介质,其中,跨模态匹配方法包括:获取待匹配文本和待匹配图像;获取任一对待匹配文本和待匹配图像之间的匹配分值;基于任一对待匹配文本和待匹配图像之间的匹配分值,确定相互匹配的待匹配文本和待匹配图像,作为匹配图文对;其中,匹配分值基于跨模态匹配模型对待匹配文本和待匹配图像匹配分析得到,跨模态匹配模型基于样本数据训练得到,样本数据包括样本图像、与样本图像匹配的样本正例文本和与样本图像不匹配的样本负例文本,且样本负例文本基于知识图谱对样本正例文本进行改造得到。上述方案,能够提升跨模态匹配的匹配精度。

    文本要素提取方法、装置、电子设备及存储介质

    公开(公告)号:CN114266238A

    公开(公告)日:2022-04-01

    申请号:CN202111530417.5

    申请日:2021-12-14

    摘要: 本发明提供一种文本要素提取方法、装置、电子设备及存储介质,其中方法包括:确定待识别文本;对所述待识别文本中的每个子句进行要素粒度分类,得到所述每个子句的要素粒度类型,所述要素粒度类型为句粒度或词粒度;基于所述每个子句的要素粒度类型,对所述待识别文本进行要素提取,得到目标要素文本。本发明提供的方法、装置、电子设备及存储介质,能够通过对待识别文本中的每个子句进行词粒度和句粒度的分类,每个子句通过其对应的粒度类型进行要素提取,得到目标要素文本,实现了基于使用词粒度结合句粒度对文本进行非连续要素提取,在保证识别准确率的同时,还提高了识别的时效性,进而提高了要素提取的准确率和时效性。

    要素抽取方法、装置、电子设备和存储介质

    公开(公告)号:CN114238550A

    公开(公告)日:2022-03-25

    申请号:CN202111538301.6

    申请日:2021-12-15

    摘要: 本发明提供一种要素抽取方法、装置、电子设备和存储介质,其中方法包括:获取待抽取文本,以及待抽取文本的词汇集合;基于待抽取文本中每两个字符对应的字符串与词汇集合间的匹配结果,确定每两个字符间的相关度,字符串以对应两个字符为起终点在待抽取文本中截取得到;基于每两个字符间的相关度,对待抽取文本中的各字符进行编码,得到各字符的要素边界特征;基于各字符的要素边界特征,确定待抽取文本的要素抽取结果。本发明提供的要素抽取方法、装置、电子设备和存储介质,不需要将匹配到的词汇与原始句子进行拼接,不会改变原有的输入长度,从而提高了编码效率。此外,相较于现有词汇拼接的方法,节约了存储空间。