-
公开(公告)号:CN115221331A
公开(公告)日:2022-10-21
申请号:CN202110421112.4
申请日:2021-04-19
申请人: 华为云计算技术有限公司 , 中国人民大学
IPC分类号: G06F16/36 , G06F40/295 , G06N3/04 , G06N3/08 , G06Q30/06
摘要: 本申请是关于一种描述文本生成方法、装置、计算机设备及存储介质。涉及互联网技术领域。该方法包括:构建目标对象对应的对象知识图谱,对象知识图谱用于表征目标对象对应属性实体词和属性特征词之间的关系;将对象知识图谱输入属性预测模型中,得到属性预测模型输出的属性序列,属性预测模型用于预测与生成目标对象对应对象描述文本相关的对象属性,属性序列中包含至少一个对象属性;将对象知识图谱和属性序列输入文本生成模型,得到文本生成模型输出的对象描述文本,文本生成模型用于根据对象知识图谱生成各个对象属性对应的描述语句,并基于描述语句组成对象描述文本。实现了自动化的对象描述文本生成过程,有利于提高对象描述文本的生成效率。
-
公开(公告)号:CN113806568A
公开(公告)日:2021-12-17
申请号:CN202110915601.5
申请日:2021-08-10
申请人: 中国人民大学 , 北京达佳互联信息技术有限公司
IPC分类号: G06F16/435 , G06N3/04 , G06N3/08
摘要: 本公开关于一种多媒体资源推荐方法、装置、电子设备及存储介质,该方法包括响应于目标对象的多媒体资源获取请求,获取目标对象的历史行为序列信息和待推荐的至少一个多媒体资源的第一资源标识信息,历史行为序列信息包括目标对象在预设时间段内行为过的多个多媒体资源的第二资源标识信息和多个多媒体资源对应的第一数量个时序标识信息;将历史行为序列信息和第一资源标识信息输入兴趣识别网络进行兴趣识别,得到目标对象对至少一个多媒体资源的目标兴趣指标;基于目标兴趣指标,将至少一个多媒体资源中的目标多媒体资源推荐给目标对象。利用本公开实施例可以提升推荐精准性和效果。
-
公开(公告)号:CN112990297A
公开(公告)日:2021-06-18
申请号:CN202110262221.6
申请日:2021-03-10
申请人: 北京智源人工智能研究院 , 中国人民大学
IPC分类号: G06K9/62 , G06N3/04 , G06N3/08 , G06F16/583 , G06F16/33
摘要: 本申请提出一种多模态预训练模型的训练方法、应用方法及装置,该方法包括:构建双塔结构的多模态预训练模型;获取包括正样本图文对的正样本数据集和包括负样本图文对的负样本数据集;根据正样本数据集和负样本数据集训练多模态预训练模型,多模态预训练模型包括用于对正样本图文对和负样本图文对进行图文相似度对比学习的跨模态对比学习模块。本申请中多模态预训练模型采用双塔结构和跨模态对比学习算法,对图像和文本模态都构建大量负样本,模型表达能力强,提高了图文对的处理精度。该模型计算图文间的整体相似度,根据相似度判断图文是否对应,基于图文弱相关假设,更贴合实际应用中图文对中图文间语义弱相关的实际情况。
-
公开(公告)号:CN107133211B
公开(公告)日:2020-06-16
申请号:CN201710285190.X
申请日:2017-04-26
发明人: 赵鑫
IPC分类号: G06F40/211 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明提供一种基于注意力机制的作文评分方法,所述方法包括,在作文评分系统中采用单词—句子—文档三层结构的神经网络注意力框架,并使用人工抽取的特征在所述框架的句子和文档层进行融合,进而设置所述句子和文档层的注意力权重。本发明综合考虑语言的局部特性和全局特性,句子的完整程度、用词的准确性、词汇的多样性、语句的连贯性以及是否离题等因素对评分任务的影响,最大程度提升作文打分的效果。
-
公开(公告)号:CN110598954A
公开(公告)日:2019-12-20
申请号:CN201910902981.1
申请日:2019-09-24
申请人: 中国人民大学
摘要: 本发明提供了一种基于深度学习的利用评审意见预测论文被引用数的方法,其利用深度组件和宽度组件联合对论文评审意见进行训练;深度组件包括摘要-评论匹配机制以及交叉评论匹配机制,用于学习评审意见的深度特征;首先,所述摘要-评论匹配机制抽取出与摘要相关的评论,去除对预测论文被引用数不相关的信息;然后,所述交叉评论匹配机制捕捉不同评审意见之间的一致性和多样性,以此来刻画多个评审员之间的交互;同时,通过所述宽度组件集成宽度特征;最后,利用深度组件和宽度组件联合进行论文被引用数的预测。本发明深度刻画了评审意见中的语义信息,丰富了语义表示,通过挖掘评审意见的文本信息,使得论文被引用数的预测更准确。
-
公开(公告)号:CN107133224A
公开(公告)日:2017-09-05
申请号:CN201710274116.8
申请日:2017-04-25
申请人: 中国人民大学
IPC分类号: G06F17/28
摘要: 本发明提供一种基于主题词的语言生成方法,使用传统的Seq2Seq模型对上下文以及主题词进行训练,在模型编码部分计算出输入Xi的隐层信息所对应的中间层信息ci,同时将主题词的词向量也通过注意力机制生成中间层信息oi,将ci和oi通过所述联合注意力机制的结构,使二者共同影响最终生成不仅与上下文相关,而且和主题词相关的序列。本发明提供的一种基于主题词的语言生成方法,而且使得生成的文本更加流畅以及富有多样性,不仅为用户提供了便捷,而且对潜在用户的购买决策起到了导向作用。
-
-
-
-
-