多模态预训练模型的训练方法、应用方法及装置

    公开(公告)号:CN112990297B

    公开(公告)日:2024-02-02

    申请号:CN202110262221.6

    申请日:2021-03-10

    摘要: 况。本申请提出一种多模态预训练模型的训练方法、应用方法及装置,该方法包括:构建双塔结构的多模态预训练模型;获取包括正样本图文对的正样本数据集和包括负样本图文对的负样本数据集;根据正样本数据集和负样本数据集训练多模态预训练模型,多模态预训练模型包括用于对正样本图文对和负样本图文对进行图文相似度对比学习的跨模态对比学习模块。本申请中多模态预训练模型采用双塔结构和跨模态对比学习算法,对图像和文本模态都构建大量负样本,模型表达能力强,提高了图文对的处理精度。该(56)对比文件Junhua Mao 等.Training and EvaluatingMultimodal Word Embeddings with Large-scale Web Annotated Images《.MachineLearning》.2016,1-9.Yu Liu.Learning a Recurrent ResidualFusion Network for Multimodal Matching.《2017 IEEE International Conference onComputer Vision (ICCV)》.2017,1-10.

    多模态预训练模型的训练方法、应用方法及装置

    公开(公告)号:CN112990297A

    公开(公告)日:2021-06-18

    申请号:CN202110262221.6

    申请日:2021-03-10

    摘要: 本申请提出一种多模态预训练模型的训练方法、应用方法及装置,该方法包括:构建双塔结构的多模态预训练模型;获取包括正样本图文对的正样本数据集和包括负样本图文对的负样本数据集;根据正样本数据集和负样本数据集训练多模态预训练模型,多模态预训练模型包括用于对正样本图文对和负样本图文对进行图文相似度对比学习的跨模态对比学习模块。本申请中多模态预训练模型采用双塔结构和跨模态对比学习算法,对图像和文本模态都构建大量负样本,模型表达能力强,提高了图文对的处理精度。该模型计算图文间的整体相似度,根据相似度判断图文是否对应,基于图文弱相关假设,更贴合实际应用中图文对中图文间语义弱相关的实际情况。

    推荐模型的预训练方法、调整方法、推荐方法及相关产品

    公开(公告)号:CN117216553A

    公开(公告)日:2023-12-12

    申请号:CN202310993505.1

    申请日:2023-08-08

    摘要: 本申请公开一种推荐模型的预训练方法、调整方法、推荐方法及相关产品。首先获取对象的单源域行为序列,以及获取单源域行为序列中的内容对应的多模态信息,其中多模态信息包括至少两种不同模态的信息;在模型预训练之初,处理得到内容在多域通用内容表示空间的多模态向量表示;在模型预训练期间,由待训练推荐模型基于行为向量表示,预测对象触发单源域行为序列的末尾内容之后触发的首个相同源域的内容,最后得到初步推荐模型。结合上述模型预训练过程可知,在本申请中采用了至少两种不同模态的信息,使各种模态的信息可以相互补充,以构建充分的训练数据集,从而使得预训练后得到的模型可以更具备稳健性。

    资源推送模型的获取、资源推送方法及存储介质

    公开(公告)号:CN116450928A

    公开(公告)日:2023-07-18

    申请号:CN202310184707.1

    申请日:2023-02-28

    摘要: 本申请公开了一种资源推送模型的获取、资源推送方法及存储介质,属于计算机技术领域。方法包括:调用初始资源推送模型对第一对象的历史访问数据进行处理,得到第一对象特征向量;调用初始资源推送模型对多个第二对象的历史访问数据进行处理,得到多个第二对象特征向量;根据第一对象特征向量和多个第二对象特征向量,在多个第二对象中确定至少一个相关对象;根据第一对象特征向量和至少一个相关对象的第二对象特征向量,确定目标损失值;基于目标损失值大于损失值阈值,对初始资源推送模型进行更新,得到目标资源推送模型。该方法得到的目标资源推送模型能够为对象进行较为准确的资源推送,提高推送资源被点击的概率、资源推送的效果。

    基于深度学习的利用评审意见预测论文被引用数的方法

    公开(公告)号:CN110598954B

    公开(公告)日:2022-03-11

    申请号:CN201910902981.1

    申请日:2019-09-24

    摘要: 本发明提供了一种基于深度学习的利用评审意见预测论文被引用数的方法,其利用深度组件和宽度组件联合对论文评审意见进行训练;深度组件包括摘要‑评论匹配机制以及交叉评论匹配机制,用于学习评审意见的深度特征;首先,所述摘要‑评论匹配机制抽取出与摘要相关的评论,去除对预测论文被引用数不相关的信息;然后,所述交叉评论匹配机制捕捉不同评审意见之间的一致性和多样性,以此来刻画多个评审员之间的交互;同时,通过所述宽度组件集成宽度特征;最后,利用深度组件和宽度组件联合进行论文被引用数的预测。本发明深度刻画了评审意见中的语义信息,丰富了语义表示,通过挖掘评审意见的文本信息,使得论文被引用数的预测更准确。

    一种基于知识增强记忆网络的序列推荐方法

    公开(公告)号:CN108921657B

    公开(公告)日:2021-06-29

    申请号:CN201810658783.0

    申请日:2018-06-25

    发明人: 赵鑫 黄瑾 文继荣

    IPC分类号: G06Q30/06 G06N3/02

    摘要: 本发明提供一种基于知识增强记忆网络的序列推荐方法,利用GRU获取用户的序列偏好表示,利用KV‑MN来存储知识库信息,并通过KV‑MNs构建基于属性的用户偏好表示,将所述序列偏好表示和所述基于属性的用户偏好表示合并生成最终的用户表示。使得本发明能够具有两类模型的优点;将产品和知识库中的实体关联在一起,使用了大规模的知识库信息提升了序列推荐结果;通过使用知识库中的实体属性信息,提高了KV‑MNs的语义表示能力,从而使得推荐过程在一定程度上可以被解释。

    一种基于知识增强记忆网络的序列推荐方法

    公开(公告)号:CN108921657A

    公开(公告)日:2018-11-30

    申请号:CN201810658783.0

    申请日:2018-06-25

    发明人: 赵鑫 黄瑾 文继荣

    IPC分类号: G06Q30/06 G06N3/02

    摘要: 本发明提供一种基于知识增强记忆网络的序列推荐方法,利用GRU获取用户的序列偏好表示,利用KV-MN来存储知识库信息,并通过KV-MNs构建基于属性的用户偏好表示,将所述序列偏好表示和所述基于属性的用户偏好表示合并生成最终的用户表示。使得本发明能够具有两类模型的优点;将产品和知识库中的实体关联在一起,使用了大规模的知识库信息提升了序列推荐结果;通过使用知识库中的实体属性信息,提高了KV-MNs的语义表示能力,从而使得推荐过程在一定程度上可以被解释。

    物品推荐的方法、装置、设备及存储介质

    公开(公告)号:CN117370657A

    公开(公告)日:2024-01-09

    申请号:CN202311324897.9

    申请日:2023-10-12

    摘要: 本申请涉及物品推荐技术领域,提供一种物品推荐的方法、装置、设备及存储介质,该物品推荐的方法包括:通过获取目标对象的物品交互序列,物品交互序列为目标对象在目标时间段内在目标平台交互的物品序列;将物品交互序列输入训练后的物品推荐模型中,以预测待推荐物品,向目标对象推荐所述待推荐物品。由于本申请实施例物品推荐模型为通过多个推荐大模型训练目标推荐模型后得到的模型,多个推荐大模型为多个不同领域的预训练模型,因此,本申请实施例物品推荐模型,可以将多个推荐大模型储存的知识迁移到物品推荐小模型上进行物品推荐,提高物品推荐效率,同时能以更少的时间和储存成本进行物品推荐服务。

    一种基于双通道超图兴趣建模的对话推荐算法

    公开(公告)号:CN115408505A

    公开(公告)日:2022-11-29

    申请号:CN202211110295.9

    申请日:2022-09-13

    摘要: 本发明公开了一种基于双通道超图兴趣建模的对话推荐算法,其包括如下步骤:S1:首先对知识图谱的实体进行使用关系型卷积神经网络进行编码,通过知识图谱引入外部知识提升推荐性能;S2:抽取用户历史对话中的物品信息,通过双通道超图建模的方式进行增强其表示;S3:为了让推荐结果首先关注当前的对话内容,避免过度拟合到历史兴趣上去,利用多头注意力机制进行检索与权衡;S4:构建了一个知识增强的编码器‑解码器框架,根据用户的兴趣偏好生成有意义的回复。本发明引入用户的历史对话作为先验知识,并将其中的实体信息构造为两类超图进行建模,从而提升模型对于用户兴趣的理解。

    一种基于联邦学习的隐私保护跨领域推荐系统

    公开(公告)号:CN115033780A

    公开(公告)日:2022-09-09

    申请号:CN202210484040.2

    申请日:2022-05-06

    发明人: 赵鑫 田长鑫

    摘要: 本发明公开了一种基于联邦学习的隐私保护跨领域推荐系统,其包括如下步骤:S1:单个域内的私有更新,即通过图迁移模块来融合用户全局和本地偏好,并基于域内数据用梯度下降算法局部更新全局和本地偏好;S2:在私有更新后,采用联邦更新过程来协作学习基于多域数据的全局用户首选项,并通过个性化聚合使这些全局首选项适应异构域数据;S3:使用周期同步机制降低通信成本。本申请所提出的基于联邦学习的隐私保护跨领域推荐系统从多个层面保护用户隐私信息。在本发明中,每个域的原始交互数据在本地存储在域的私有空间中,不会上传到其他域,这样可以有效的降低隐私泄露的风险。