实体关系抽取方法、装置、电子设备和存储介质

    公开(公告)号:CN113221566B

    公开(公告)日:2023-08-01

    申请号:CN202110501443.9

    申请日:2021-05-08

    摘要: 本申请公开了实体关系抽取方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及知识图谱、自然语言处理和深度学习等人工智能技术领域。具体实现方案为:获取输入文本;调用文本词类标注模型对输入文本进行文本词标注以生成文本词标注结果;根据文本词标注结果生成实体对集;以及调用关系分类模型对输入文本和实体对集进行关系检测以生成文本实体关系结果。由此,可以有效地对输入文本的实体关系进行检测,进而提高实体关系抽取结果的准确性。

    基于人工智能的文本生成方法和装置

    公开(公告)号:CN109670185B

    公开(公告)日:2023-06-23

    申请号:CN201811613381.5

    申请日:2018-12-27

    发明人: 陈艳 刘凯 吕雅娟

    摘要: 本申请提出一种基于人工智能的文本生成方法、装置、计算机设备以及可读存储介质,其中,方法包括:对上文语句进行编码,得到上文语句的隐状态,分别根据上文语句的语义和韵律,对上文语句的隐状态进行至少两次解码,得到与上文语句匹配的下文语句。该方法分别根据上文语句的语义和韵律,对上文语句进行编码得到的隐状态进行至少两次解码,使得生成的下文语句能同时满足语义和韵律的限制,从而使生成的下文语句更加具有诗意,从而满足了用户的需求。

    文本处理方法、用于短文本的链指方法、装置及存储介质

    公开(公告)号:CN114818736A

    公开(公告)日:2022-07-29

    申请号:CN202210612667.1

    申请日:2022-05-31

    IPC分类号: G06F40/30 G06K9/62

    摘要: 本公开提供了一种文本处理方法、用于短文本的链指方法、装置、设备、存储介质以及计算机程序产品,涉及知识图谱、深度学习、自然语言处理等人工智能技术领域。具体实现方案为:为歧义词的每个词义项构建文本数据集,其中,歧义词对应多个词义项;对包含歧义词的短文本进行语义解析,得到多个候选消歧词;将每个候选消歧词分别与每个词义项的文本数据集进行匹配;响应于一个候选消歧词仅与一个词义项的文本数据集匹配成功,将该候选消歧作为相匹配的词义项的目标消歧词;将包含目标消歧词的短文本,保存至相匹配的词义项的消歧文本集。获得的消歧文本集精准且简洁。

    用于文本处理的知识图谱扩充方法及装置

    公开(公告)号:CN110427496B

    公开(公告)日:2022-06-03

    申请号:CN201910715577.3

    申请日:2019-08-05

    IPC分类号: G06F16/36 G06F40/295

    摘要: 本发明实施例提供一种用于文本处理的知识图谱扩充方法及装置,电子设备接收到用户输入的关联请求后,判断文本片段是否能够关联至知识图谱已收录的实体,若无法将文本片段关联至知识图谱已收录的实体,则根据知识图谱中每个实体类别的类别向量,对所述知识图谱进行扩充,从而扩充知识图谱中实体的数量,实现增强知识图谱表示能力、提升文本处理任务的准确性。

    信息确定方法、模型训练方法、装置及电子设备

    公开(公告)号:CN114491177A

    公开(公告)日:2022-05-13

    申请号:CN202210138775.X

    申请日:2022-02-15

    发明人: 张惠玲 吕雅娟

    摘要: 本公开提供了一种信息确定方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及大数据、知识图谱技术领域,可应用于数据处理、信息抽取等场景,具体实现方案包括:获取第一记录信息,所述第一记录信息包括M个第一特征,M为正整数;从预先获取的N个标准记录信息中确定第二记录信息,其中,所述第二记录信息包括与所述M个第一特征中分别对应的M个第二特征,以及与所述M个第二特征匹配的处理信息,所述第二记录信息与所述第一记录信息的第一相似度满足预设条件,所述第一相似度等于M个第二相似度的加权和,所述M个第二相似度为所述M个第一特征与所述M个第二特征之间的相似度,N为正整数;输出所述处理信息。

    关注点的层次化构建方法、装置和计算机设备

    公开(公告)号:CN108280221B

    公开(公告)日:2022-04-15

    申请号:CN201810128902.1

    申请日:2018-02-08

    摘要: 本申请提出一种关注点的层次化构建方法、装置和计算机设备,上述关注点的层次化构建方法包括:爬取至少两个数据源的概念层次体系;对爬取的概念层次体系中相同垂类的相同概念层次进行融合,获得特定垂类的分类体系;对特定垂类的分类体系中的概念进行层次化处理,获得特定垂类的关注点概念层次体系;获取已挖掘的关注点的上位词,根据所述关注点的上位词将所述关注点关联到所述特定垂类的关注点概念层次体系。本申请可以实现增强关注点的描述和关注点逻辑推理上的组织,有效描述用户的更上层关注点,并且概念层次的粒度准确而不细碎,可以精确地表述用户的一类兴趣。

    命名实体识别方法、训练方法、装置、电子设备及介质

    公开(公告)号:CN114330344A

    公开(公告)日:2022-04-12

    申请号:CN202111608157.9

    申请日:2021-12-24

    摘要: 本公开提供了一种命名实体识别方法、命名实体识别模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及数据处理技术领域,尤其涉及知识图谱、深度学习等人工智能技术领域,具体涉及医疗、军事、金融、能源、电力、化工、科研、水利、运输、文娱、教育等技术领域。具体实现方案为:确定训练样本,训练样本包括样本文本和待确认样本标注结果序列;利用初始命名实体识别模型处理样本文本,得到样本标签置信度集合序列;基于样本标签置信度集合序列和待确认样本标注结果序列,确定样本文本的目标样本标注结果序列;以及利用样本标签置信度集合序列和目标样本标注结果序列调整初始命名实体识别模型的参数,得到命名实体识别模型。