一种表格解析方法、装置、设备和存储介质

    公开(公告)号:CN116306566A

    公开(公告)日:2023-06-23

    申请号:CN202211098485.3

    申请日:2022-09-08

    IPC分类号: G06F40/205

    摘要: 本申请公开了一种表格解析方法、装置、设备和存储介质,该方法包括:获取待解析的目标表格;确定目标表格中包含的若干表头单元格和若干数据单元格;基于若干表头单元格中的文本信息,得到各表头单元格间的层级关系;基于各表头单元格间的层级关系,得到若干数据单元格和至少一个表头单元格间的对应结果。通过上述方式,本申请能够实现对各种表格的解析,适用性和泛化能力强。

    基于时序知识图谱的问答方法、实体表示方法及相关装置

    公开(公告)号:CN115374296B

    公开(公告)日:2023-04-04

    申请号:CN202211308301.1

    申请日:2022-10-25

    摘要: 本申请公开了一种基于时序知识图谱的问答方法、实体表示方法及相关装置,该方法包括:获取目标问题;利用时序知识图谱中各知识实体的语义表示,查找到与目标问题中的目标实体相关的知识实体,作为关联实体;基于时序知识图谱中包含关联实体的至少一条知识,得到目标问题的答案,其中,知识实体的语义表示是基于知识的知识表示是对知识的图谱表示和文本表示融合得到,知识包含知识实体和时间。上述方式,通过文本表示与图谱表示融合以得到的实体的语义表示,语义表示融合了文本表示和图谱表示,能够更为全面的表示实体,从而更为准确地理解目标问题中的目标实体,进而提高时序知识图谱问答结果的准确性。

    篇章处理方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115774792A

    公开(公告)日:2023-03-10

    申请号:CN202310106687.6

    申请日:2023-02-13

    摘要: 本申请公开了一种篇章处理方法及相关装置、电子设备、存储介质,该方法包括:获取待处理篇章和关系集合;基于待处理篇章进行编码,得到实体对的第一编码特征和待处理篇章中句子的第二编码特征;基于实体对的第一编码特征和句子的第二编码特征,预测得到句子作为确定实体对之间实体关系的证据句的置信度;基于各个句子分别作为实体对的证据句的置信度,在待处理篇章中为实体对选择作为证据句的句子;基于待处理篇章和实体对的证据句,选择作为实体对之间实体关系的预设关系,得到实体对的第一关系抽取结果。通过上述方式,能够提高实体关系抽取的准确性。

    实体关系抽取方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115168619B

    公开(公告)日:2022-12-27

    申请号:CN202211085634.2

    申请日:2022-09-06

    IPC分类号: G06F16/36 G06F40/295

    摘要: 本申请涉及人工智能技术领域,公开了一种实体关系抽取方法及相关装置、电子设备、存储介质,其中,实体关系抽取方法包括:识别待处理文本中的各个实体;基于各个实体进行预测,得到若干候选关系;其中,候选关系表征各个实体之间疑似存在的实体关系;基于各个实体和若干候选关系,生成得到若干假设文本;其中,假设文本表征假设两个实体之间真实存在候选关系的自然语言文本;基于假设文本的推理结果,确定假设文本中两个实体之间是否真实存在候选关系。上述方案,能够降低实体关系抽取的计算量,特别是在存在关系嵌套时尽可能地减少冗余计算。

    基于时序知识图谱的问答方法、实体表示方法及相关装置

    公开(公告)号:CN115374296A

    公开(公告)日:2022-11-22

    申请号:CN202211308301.1

    申请日:2022-10-25

    摘要: 本申请公开了一种基于时序知识图谱的问答方法、实体表示方法及相关装置,该方法包括:获取目标问题;利用时序知识图谱中各知识实体的语义表示,查找到与目标问题中的目标实体相关的知识实体,作为关联实体;基于时序知识图谱中包含关联实体的至少一条知识,得到目标问题的答案,其中,知识实体的语义表示是基于知识的知识表示是对知识的图谱表示和文本表示融合得到,知识包含知识实体和时间。上述方式,通过文本表示与图谱表示融合以得到的实体的语义表示,语义表示融合了文本表示和图谱表示,能够更为全面的表示实体,从而更为准确地理解目标问题中的目标实体,进而提高时序知识图谱问答结果的准确性。

    跨模态匹配方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115270754A

    公开(公告)日:2022-11-01

    申请号:CN202211138842.4

    申请日:2022-09-19

    摘要: 本申请公开了一种跨模态匹配方法及相关装置、电子设备、存储介质,其中,跨模态匹配方法包括:获取待匹配文本和待匹配图像;获取任一对待匹配文本和待匹配图像之间的匹配分值;基于任一对待匹配文本和待匹配图像之间的匹配分值,确定相互匹配的待匹配文本和待匹配图像,作为匹配图文对;其中,匹配分值基于跨模态匹配模型对待匹配文本和待匹配图像匹配分析得到,跨模态匹配模型基于样本数据训练得到,样本数据包括样本图像、与样本图像匹配的样本正例文本和与样本图像不匹配的样本负例文本,且样本负例文本基于知识图谱对样本正例文本进行改造得到。上述方案,能够提升跨模态匹配的匹配精度。

    文本要素提取方法、装置、电子设备及存储介质

    公开(公告)号:CN114266238A

    公开(公告)日:2022-04-01

    申请号:CN202111530417.5

    申请日:2021-12-14

    摘要: 本发明提供一种文本要素提取方法、装置、电子设备及存储介质,其中方法包括:确定待识别文本;对所述待识别文本中的每个子句进行要素粒度分类,得到所述每个子句的要素粒度类型,所述要素粒度类型为句粒度或词粒度;基于所述每个子句的要素粒度类型,对所述待识别文本进行要素提取,得到目标要素文本。本发明提供的方法、装置、电子设备及存储介质,能够通过对待识别文本中的每个子句进行词粒度和句粒度的分类,每个子句通过其对应的粒度类型进行要素提取,得到目标要素文本,实现了基于使用词粒度结合句粒度对文本进行非连续要素提取,在保证识别准确率的同时,还提高了识别的时效性,进而提高了要素提取的准确率和时效性。

    要素抽取方法、装置、电子设备和存储介质

    公开(公告)号:CN114238550A

    公开(公告)日:2022-03-25

    申请号:CN202111538301.6

    申请日:2021-12-15

    摘要: 本发明提供一种要素抽取方法、装置、电子设备和存储介质,其中方法包括:获取待抽取文本,以及待抽取文本的词汇集合;基于待抽取文本中每两个字符对应的字符串与词汇集合间的匹配结果,确定每两个字符间的相关度,字符串以对应两个字符为起终点在待抽取文本中截取得到;基于每两个字符间的相关度,对待抽取文本中的各字符进行编码,得到各字符的要素边界特征;基于各字符的要素边界特征,确定待抽取文本的要素抽取结果。本发明提供的要素抽取方法、装置、电子设备和存储介质,不需要将匹配到的词汇与原始句子进行拼接,不会改变原有的输入长度,从而提高了编码效率。此外,相较于现有词汇拼接的方法,节约了存储空间。