-
公开(公告)号:CN116976341A
公开(公告)日:2023-10-31
申请号:CN202211477575.3
申请日:2022-11-23
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06F40/295 , G06F16/35 , G06F18/25 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
摘要: 本申请提供一种实体识别方法、装置、电子设备、存储介质及程序产品,涉及人工智能、机器学习、云计算技术领域。通过基于知识图谱对各个训练文本中的实体词进行标注;并通过滤掉各个训练文本中的噪声文本得到第一训练数据,从而保证了训练文本的质量。并通过编码器逐字编码得到各个字的编码特征,并从目标实体词表中查找每个训练文本中每个字对应的匹配词;基于每个字分别与各个匹配词之间的相似度,对每个字的编码特征与各个匹配词的词特征进行融合,得到每个字的第一融合特征。通过解码器进行逐字识别;基于标注实体词和预测实体词进行迭代训练得到实体识别模型。逐字输出能有效识别嵌套实体,可有针对性的提高对特定任务的实体识别的准确性。
-
公开(公告)号:CN116932784A
公开(公告)日:2023-10-24
申请号:CN202210322890.2
申请日:2022-03-29
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06F16/435 , G06F18/214 , G06N3/042 , G06N3/045 , G06N3/08
摘要: 本发明提供了一种多媒体信息推荐模型训练方法、装置、电子设备,方法包括:基于所述目标对象的历史数据,提取预训练信息集合;构建多媒体信息推荐模型的图神经网络;通过训练样本集合,对所述多媒体信息推荐模型中的第一推荐网络进行训练,确定所述第一推荐网络的网络参数;计算所述训练样本集合中每个标签的预训练向量;根据所述每个标签的预训练向量和所述训练样本集合,对所述多媒体信息推荐模型中的第二推荐网络进行训练,确定所述第二推荐网络的网络参数,由此,增强了多媒体信息推荐的准确性与关联性,提升多媒体信息推荐模型的泛化性,本发明实施例还可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。
-
公开(公告)号:CN116629338A
公开(公告)日:2023-08-22
申请号:CN202310859845.5
申请日:2023-07-13
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06N3/08 , G06N3/045 , G06F16/35 , G06F40/295
摘要: 本申请公开了一种模型数据的处理方法、相关装置、设备以及存储介质,涉及人工智能技术。本申请方法包括:从模型库中获取针对第一任务的N个第一父模型;根据N个第一父模型生成M个第一初始子模型;根据M个第一初始子模型,构建M个第一待训练模型;基于第一训练数据集,对每个第一待训练模型的模型参数进行更新,得到M个第一目标模型;采用第一测试数据集,对每个第一目标模型进行测试,得到每个第一目标模型的评价指标分值;将最大评价指标分值所对应的第一目标模型,作为针对第一任务的第一任务模型。在本申请中,新任务模型的训练不会影响已训练好的任务模型,新任务模型可沿用已训练好的任务模型的知识进行训练,从而提升模型训练效果。
-
公开(公告)号:CN113761837B
公开(公告)日:2023-07-25
申请号:CN202110553306.X
申请日:2021-05-20
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06F40/126 , G06F40/295 , G06F40/30 , G06F16/36 , G06N3/04 , G06N3/08 , G06N20/00
摘要: 本申请公开了一种实体关系类型确定方法、装置和设备及存储介质,涉及人工智能技术领域,用于提升实体关系类型确定的准确性。该方法包括:获取目标实体对关联的目标句袋;将目标句袋输入至已训练的实体关系确定模型,针对目标句袋中各个句子,分别执行如下操作:针对一个句子,基于一个句子中各个字符各自对应的字符表示向量,获得一个句子的句子表示向量;基于获得的各个句子表示向量,分别确定相应句子的句子权重值,每个句子权重值表征一个句子对于目标实体对的关系确定的重要程度;基于各个句子各自对应的句子表示向量和句子权重值,确定目标句袋的句袋表示向量,并基于句袋表示向量,确定目标实体对包括的两个实体之间的目标关系类型。
-
公开(公告)号:CN114648032B
公开(公告)日:2022-08-19
申请号:CN202210562170.3
申请日:2022-05-23
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06F40/30 , G06F16/332 , G06F16/33 , G06N3/08 , G06N3/04
摘要: 本申请结合人工智能技术,涉及一种语义理解模型的训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取对应于同一问题的至少一个训练样本,通过待训练的语义理解模型对至少一个训练样本进行处理,输出与同一问题对应的至少两个预测结果,基于预测结果中的至少一个确定语义理解损失,并根据至少两个预测结果间的差异确定散度损失;基于语义理解损失和散度损失构建训练损失函数;根据训练损失函数对待训练的语义理解模型进行训练,直至达到结束条件时停止训练,得到训练完成的语义理解模型,训练完成的语义理解模型用于进行知识问答匹配。采用本方法能够提高机器阅读理解的准确性和稳定性。
-
公开(公告)号:CN114676255A
公开(公告)日:2022-06-28
申请号:CN202210318205.9
申请日:2022-03-29
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06F16/35 , G06K9/62 , G06F40/247 , G06F40/284 , G06N20/20
摘要: 本申请公开了一种文本处理方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取待处理文本;将待处理文本输入目标文本分类模型中进行处理,得到待处理文本的文本分类结果。其中,目标文本分类模型是利用多个文本集进行模型训练得到的,每一个文本集包括第一文本以及与第一文本为同义文本的第二文本;目标文本分类模型是基于分类损失参数和匹配损失参数,对初始文本分类模型的模型参数进行调整得到的;分类损失参数是基于初始文本分类模型对第一文本进行处理得到的第一文本特征确定的;匹配损失参数是基于第一文本特征以及初始文本分类模型对第二文本进行处理得到的第二文本特征确定的。通过本申请,可以有效提高文本分类的准确性。
-
公开(公告)号:CN113761189A
公开(公告)日:2021-12-07
申请号:CN202110426412.1
申请日:2021-04-20
申请人: 腾讯科技(深圳)有限公司
发明人: 杨韬
IPC分类号: G06F16/35 , G06F40/194 , G06F40/232 , G06N3/08 , G06N20/00
摘要: 本申请提供一种修正文本的方法、装置、计算机设备及存储介质,可以应用于云计算领域或人工智能领域,用于解决修正文本的准确性较低的问题。该方法至少包括:采用已训练的修正模型,基于所述输入文本序列包含的各个输入文本位置上的输入子文本,分别匹配所述输入文本序列与预设的候选子文本集合中的各个候选子文本,获得针对所述各个输出文本位置的第一匹配结果;基于所述各个输入文本位置中的指定输入文本位置上的输入子文本,分别匹配所述输入文本序列与所述各个候选子文本,获得针对所述各个输出文本位置的第二匹配结果;基于获得的各个第一匹配结果和各个第二匹配结果,确定所述各个输出文本位置上的输出子文本,获得已修正的输出文本序列。
-
公开(公告)号:CN116912579A
公开(公告)日:2023-10-20
申请号:CN202310872315.4
申请日:2023-07-17
申请人: 大连理工大学
IPC分类号: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/42
摘要: 本发明属于人工智能计算机视觉领域,具体涉及一种基于多层级注意力机制的场景图生成方法。首先使用预训练的目标检测网络获取图像中的对象信息,并从图像信息中获取的动态化层级先验知识,在此基础上通过多层级注意力结构对已有对象及对象对特征进行编码,最终分类得到对象类别及关系类别并获得场景图。本发明构建了一种更清晰的方式来表达物体的层次关系,并有效的利用层级注意力,使得结果的生成更依赖于对其影响更大的子区域,提高了结果的精确度。
-
公开(公告)号:CN114461961A
公开(公告)日:2022-05-10
申请号:CN202111650276.0
申请日:2021-12-30
申请人: 大连理工大学
IPC分类号: G06F16/958 , G06F30/27 , G06K9/62 , G06F111/04
摘要: 本发明提供一种基于NMF和低秩张量的不完整多模态媒体数据聚类方法,属于媒体信息处理技术与数据挖掘技术领域。包括以下步骤:(1)应用于网络社交媒体平台的不完整多模态媒体数据预填充和分解;(2)基于不完整多模态社交媒体平台数据的低秩张量模型融合;(3)融入测量机制,学习多模态社交媒体平台数据的共识表示;(4)计算和优化联合目标函数,迭代更新直至满足收敛条件,完成聚类学习。该模型可以有效融合模态中的可见实例和视图之间的信息,以填补缺失的信息。也可以通过多个模态的高阶相关性来捕获缺失信息,这有助于获得良好的多模态聚类结果。
-
公开(公告)号:CN114461961B
公开(公告)日:2024-08-20
申请号:CN202111650276.0
申请日:2021-12-30
申请人: 大连理工大学
IPC分类号: G06F16/958 , G06F30/27 , G06F18/214 , G06F18/23213 , G06F111/04
摘要: 本发明提供一种基于NMF和低秩张量的不完整多模态媒体数据聚类方法,属于媒体信息处理技术与数据挖掘技术领域。包括以下步骤:(1)应用于网络社交媒体平台的不完整多模态媒体数据预填充和分解;(2)基于不完整多模态社交媒体平台数据的低秩张量模型融合;(3)融入测量机制,学习多模态社交媒体平台数据的共识表示;(4)计算和优化联合目标函数,迭代更新直至满足收敛条件,完成聚类学习。该模型可以有效融合模态中的可见实例和视图之间的信息,以填补缺失的信息。也可以通过多个模态的高阶相关性来捕获缺失信息,这有助于获得良好的多模态聚类结果。
-
-
-
-
-
-
-
-
-