-
公开(公告)号:CN113220836B
公开(公告)日:2024-04-09
申请号:CN202110502466.1
申请日:2021-05-08
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F16/36 , G06F40/284 , G06F40/295
摘要: 本申请公开了序列标注模型的训练方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及知识图谱、自然语言处理和深度学习等人工智能技术领域。具体实现方案为:获取样本文本,并获取待训练的序列标注模型;对样本文本进行切分以获取多个文本词,其中,文本词包括实体词和非实体词;分别对多个文本词进行标注以生成训练样本;以及根据训练样本对序列标注模型进行训练。由此,能够提高序列标注模型的准确度和多样性。
-
公开(公告)号:CN113221566B
公开(公告)日:2023-08-01
申请号:CN202110501443.9
申请日:2021-05-08
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/295 , G06F16/33 , G06F16/35
摘要: 本申请公开了实体关系抽取方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及知识图谱、自然语言处理和深度学习等人工智能技术领域。具体实现方案为:获取输入文本;调用文本词类标注模型对输入文本进行文本词标注以生成文本词标注结果;根据文本词标注结果生成实体对集;以及调用关系分类模型对输入文本和实体对集进行关系检测以生成文本实体关系结果。由此,可以有效地对输入文本的实体关系进行检测,进而提高实体关系抽取结果的准确性。
-
公开(公告)号:CN109670185B
公开(公告)日:2023-06-23
申请号:CN201811613381.5
申请日:2018-12-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F40/20 , G06F40/253 , G06N3/0455 , G06N3/0442
摘要: 本申请提出一种基于人工智能的文本生成方法、装置、计算机设备以及可读存储介质,其中,方法包括:对上文语句进行编码,得到上文语句的隐状态,分别根据上文语句的语义和韵律,对上文语句的隐状态进行至少两次解码,得到与上文语句匹配的下文语句。该方法分别根据上文语句的语义和韵律,对上文语句进行编码得到的隐状态进行至少两次解码,使得生成的下文语句能同时满足语义和韵律的限制,从而使生成的下文语句更加具有诗意,从而满足了用户的需求。
-
公开(公告)号:CN114238611B
公开(公告)日:2023-05-16
申请号:CN202111587727.0
申请日:2021-12-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06N5/022 , G16H10/60 , G06F18/241 , G06F18/2415 , G06N3/047 , G06N3/08
摘要: 本公开提供了用于输出信息的方法、装置、设备以及存储介质,涉及自然语言处理、知识图谱、深度学习等人工智能技术领域。具体实现方案为:获取用户的输入,输入包括问题以及对应的候选答案;确定输入的初始向量;根据初始向量以及预先建立的知识库,确定输入的相关知识;基于相关知识,确定候选答案属于问题的正确答案的置信度;输出与置信度对应的信息。本实现方式能够根据用户的输入从知识库中获取相关知识,从而能够提高候选答案判断的准确性。
-
公开(公告)号:CN114818736A
公开(公告)日:2022-07-29
申请号:CN202210612667.1
申请日:2022-05-31
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种文本处理方法、用于短文本的链指方法、装置、设备、存储介质以及计算机程序产品,涉及知识图谱、深度学习、自然语言处理等人工智能技术领域。具体实现方案为:为歧义词的每个词义项构建文本数据集,其中,歧义词对应多个词义项;对包含歧义词的短文本进行语义解析,得到多个候选消歧词;将每个候选消歧词分别与每个词义项的文本数据集进行匹配;响应于一个候选消歧词仅与一个词义项的文本数据集匹配成功,将该候选消歧作为相匹配的词义项的目标消歧词;将包含目标消歧词的短文本,保存至相匹配的词义项的消歧文本集。获得的消歧文本集精准且简洁。
-
公开(公告)号:CN110427496B
公开(公告)日:2022-06-03
申请号:CN201910715577.3
申请日:2019-08-05
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/36 , G06F40/295
摘要: 本发明实施例提供一种用于文本处理的知识图谱扩充方法及装置,电子设备接收到用户输入的关联请求后,判断文本片段是否能够关联至知识图谱已收录的实体,若无法将文本片段关联至知识图谱已收录的实体,则根据知识图谱中每个实体类别的类别向量,对所述知识图谱进行扩充,从而扩充知识图谱中实体的数量,实现增强知识图谱表示能力、提升文本处理任务的准确性。
-
公开(公告)号:CN114491177A
公开(公告)日:2022-05-13
申请号:CN202210138775.X
申请日:2022-02-15
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/903 , G06F16/906 , G06K9/62
摘要: 本公开提供了一种信息确定方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及大数据、知识图谱技术领域,可应用于数据处理、信息抽取等场景,具体实现方案包括:获取第一记录信息,所述第一记录信息包括M个第一特征,M为正整数;从预先获取的N个标准记录信息中确定第二记录信息,其中,所述第二记录信息包括与所述M个第一特征中分别对应的M个第二特征,以及与所述M个第二特征匹配的处理信息,所述第二记录信息与所述第一记录信息的第一相似度满足预设条件,所述第一相似度等于M个第二相似度的加权和,所述M个第二相似度为所述M个第一特征与所述M个第二特征之间的相似度,N为正整数;输出所述处理信息。
-
公开(公告)号:CN108280221B
公开(公告)日:2022-04-15
申请号:CN201810128902.1
申请日:2018-02-08
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9535 , G06F16/2458 , G06F16/35
摘要: 本申请提出一种关注点的层次化构建方法、装置和计算机设备,上述关注点的层次化构建方法包括:爬取至少两个数据源的概念层次体系;对爬取的概念层次体系中相同垂类的相同概念层次进行融合,获得特定垂类的分类体系;对特定垂类的分类体系中的概念进行层次化处理,获得特定垂类的关注点概念层次体系;获取已挖掘的关注点的上位词,根据所述关注点的上位词将所述关注点关联到所述特定垂类的关注点概念层次体系。本申请可以实现增强关注点的描述和关注点逻辑推理上的组织,有效描述用户的更上层关注点,并且概念层次的粒度准确而不细碎,可以精确地表述用户的一类兴趣。
-
公开(公告)号:CN114330344A
公开(公告)日:2022-04-12
申请号:CN202111608157.9
申请日:2021-12-24
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/295 , G06F40/30 , G06F40/242 , G06K9/62
摘要: 本公开提供了一种命名实体识别方法、命名实体识别模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及数据处理技术领域,尤其涉及知识图谱、深度学习等人工智能技术领域,具体涉及医疗、军事、金融、能源、电力、化工、科研、水利、运输、文娱、教育等技术领域。具体实现方案为:确定训练样本,训练样本包括样本文本和待确认样本标注结果序列;利用初始命名实体识别模型处理样本文本,得到样本标签置信度集合序列;基于样本标签置信度集合序列和待确认样本标注结果序列,确定样本文本的目标样本标注结果序列;以及利用样本标签置信度集合序列和目标样本标注结果序列调整初始命名实体识别模型的参数,得到命名实体识别模型。
-
公开(公告)号:CN114238611A
公开(公告)日:2022-03-25
申请号:CN202111587727.0
申请日:2021-12-23
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了用于输出信息的方法、装置、设备以及存储介质,涉及自然语言处理、知识图谱、深度学习等人工智能技术领域。具体实现方案为:获取用户的输入,输入包括问题以及对应的候选答案;确定输入的初始向量;根据初始向量以及预先建立的知识库,确定输入的相关知识;基于相关知识,确定候选答案属于问题的正确答案的置信度;输出与置信度对应的信息。本实现方式能够根据用户的输入从知识库中获取相关知识,从而能够提高候选答案判断的准确性。
-
-
-
-
-
-
-
-
-