一种基于深度学习的融合个性化和多样化的搜索方法

    公开(公告)号:CN114048386B

    公开(公告)日:2024-04-09

    申请号:CN202111391539.0

    申请日:2021-11-23

    发明人: 窦志成 王淑婷

    摘要: 本发明通过智能搜索领域的方法,实现了一种基于深度学习的融合个性化和多样化的搜索方法。方法主要通过计算一般多样性和个性化多样性的权重、多样性的动态建模、聚合各个得分结果三个步骤,基于深度学习的融合个性化和多样化的搜索模型(DFSPD模型)作为方法的核心,将多样性分为个性化的多样性和一般的多样性来同时考虑个性化和多样化对结果的影响,以根据不同情况提供更令用户满意的结果。本申请方案灵活性非常高,用户描述画像生成器,单词嵌入矩阵和个性化加权过程都可替换,在准确度上有很大的提升。

    一种融合个性化搜索与搜索结果多样化的检索方法

    公开(公告)号:CN114021019B

    公开(公告)日:2024-03-29

    申请号:CN202111327439.1

    申请日:2021-11-10

    发明人: 窦志成 刘炯楠

    摘要: 本发明通过网络安全领域的方法,实现了一种融合个性化搜索与搜索结果多样化的检索方法与系统。从符合用户个性化需求和文档新颖性两个角度为文档计算个性化得分和多样化得分。通过计算当前查询和用户历史之间的相似度来分配个性化得分和多样化得分的权重,从而获得该文档的最终得分。本发明提供的方法通过综合考虑文档在个性化方面和多样化方面不同的得分,来提升模糊查询下搜索结果的用户满意度。利用transformer机制,设计了层次化的信息抽取机制,从用户检索历史和候选文档集中分别求出个性化得分和多样化得分。并通过两种不同的类似LambdaRank方式的损失函数来训练模型。

    多模态预训练模型的训练方法、应用方法及装置

    公开(公告)号:CN112990297B

    公开(公告)日:2024-02-02

    申请号:CN202110262221.6

    申请日:2021-03-10

    摘要: 况。本申请提出一种多模态预训练模型的训练方法、应用方法及装置,该方法包括:构建双塔结构的多模态预训练模型;获取包括正样本图文对的正样本数据集和包括负样本图文对的负样本数据集;根据正样本数据集和负样本数据集训练多模态预训练模型,多模态预训练模型包括用于对正样本图文对和负样本图文对进行图文相似度对比学习的跨模态对比学习模块。本申请中多模态预训练模型采用双塔结构和跨模态对比学习算法,对图像和文本模态都构建大量负样本,模型表达能力强,提高了图文对的处理精度。该(56)对比文件Junhua Mao 等.Training and EvaluatingMultimodal Word Embeddings with Large-scale Web Annotated Images《.MachineLearning》.2016,1-9.Yu Liu.Learning a Recurrent ResidualFusion Network for Multimodal Matching.《2017 IEEE International Conference onComputer Vision (ICCV)》.2017,1-10.

    查询结果的排序方法、装置、电子设备以及存储介质

    公开(公告)号:CN111435378B

    公开(公告)日:2023-09-05

    申请号:CN201910030272.9

    申请日:2019-01-14

    发明人: 窦志成 周雨佳

    IPC分类号: G06F16/9535

    摘要: 本发明提供一种查询结果的排序方法、装置、电子设备以及存储介质,包括:获取用户输入的关键词;确定关键词对应的多个查询结果;将关键词和多个查询结果作为查询模型的输入,获取查询模型输出的用户的短期兴趣特征和长期兴趣特征;查询模型是以用户历史输入的多个历史关键词,以及,多个历史关键词对应的历史查询结果训练建立的;根据短期兴趣特征和长期兴趣特征,对多个查询结果进行排序;输出排序后的查询结果。本发明提供的查询结果的排序方法,通过确定当前查询的短期兴趣特征和长期兴趣特征,提高了查询结果排序的准确性。

    基于记忆网络的个性化搜索方法及系统

    公开(公告)号:CN111310023B

    公开(公告)日:2023-06-30

    申请号:CN202010042175.4

    申请日:2020-01-15

    发明人: 窦志成 文继荣

    摘要: 本发明涉及一种基于记忆网络的个性化搜索方法及系统,该方法的具体过程为:S1、基于记忆网络,根据用户当前需求从查询内存和文档内存中动态寻找相关的历史行为;S2、基于记忆网络,从意图内存中寻找与查询和文档相关的会话信息;S3、根据历史信息和会话信息,预测每一个候选文档被点击的概率,并结合文档与查询的相关性,完成候选文档的个性化重排。本发明针对用户搜索行为中的重查行为,使用记忆网络来存储完善的用户信息,从而强化重查行为的识别与影响力,进而改善个性化搜索结果。

    一种基于上下文表示学习的性化搜索方法

    公开(公告)号:CN112182373B

    公开(公告)日:2023-06-02

    申请号:CN202011021934.5

    申请日:2020-09-25

    发明人: 窦志成 周雨佳

    摘要: 本发明通过人工智能领域的方法,实现了一种基于上下文表示学习的性化搜索方法,将用户历史编码为语境信息来强化查询表示。我们分别设计了查询消歧和意图预测两个部分来对推断用户的信息需求,他们运用层次化transformer来编码语境信息,查询消歧将查询语境的输入划分为查询单词、短期历史和长期历史三个层面,并分别进行消歧操作。两个部分的输出通过门控单元融合,我们设计了两种损失函数来优化整个模型;之后对所述查询消岐模型的分析结果和所述已有查询日志预测结果进行融合和重排运算,并对结果进行优化。通过上述手段,在不建立用户模型的基础上对用户历史进行编码,理解用户基于当前查询的真实需求和真实意图。

    一个基于记忆神经网络的对话式信息检索的方法

    公开(公告)号:CN111177357B

    公开(公告)日:2023-05-23

    申请号:CN201911406907.7

    申请日:2019-12-31

    发明人: 窦志成 文继荣

    摘要: 本发明提出一种基于记忆神经网络的对话式信息检索的方法,通过建立检索模型,所述检索模型包括用户总体查询意图建模、当前查询特定意图建模和统计特征引入,所述用户总体查询意图建模利用用户的历史查询和历史点击信息建模会话内用户的整体查询意图,所述当前查询特定意图建模通过对当前查询词分析,找到最能表示当前特定查询意图的查询词来与文档进行交互,所述统计特征引入用于直接地衡量候选文档与整个查询序列的关系。

    一种融合搜索行为与好友网络的个性化搜索方法与系统

    公开(公告)号:CN113987366A

    公开(公告)日:2022-01-28

    申请号:CN202111253279.0

    申请日:2021-10-27

    IPC分类号: G06F16/9536 G06N3/04 G06N3/08

    摘要: 本发明通过人工智能处理领域的方法,实现了一种融合搜索行为与好友网络的个性化搜索方法与应用该方法的系统。方法提出了一个基于组的个性化搜索模型,该模型整合了搜索行为和好友网络,利用短期历史和长期历史来完善用户画像,并通过将朋友关系和搜索行为结合起来,将用户的搜索行为与好友网络结合起来构建基于组的用户画像,并通过神经网络强化相似的用户的影响。在基于关系和基于行为的好友圈的交互作用下,同时出现在两种类型的好友圈中的用户得到了进一步强化,从而建立基于组的用户画像。该模型结合基于当前查询构建的个人画像和组画像来个性化搜索结果。

    一种基于用户对话历史的个性化对话生成方法与系统

    公开(公告)号:CN113779224A

    公开(公告)日:2021-12-10

    申请号:CN202111081329.1

    申请日:2021-09-15

    摘要: 本发明通过人工智能处理领域的方法,实现了一种基于用户对话历史的个性化对话生成方法与应用该方法的系统。方法针对采集到的历史对话以及用户输入,通过包括一个编码器和一个解码器的基于Seq2Seq模型结构的个性化回复模型处理对话和输入,基于Seq2Seq模型的个性化回复生成模型由对话历史编码器与用户静态画像、个性化输入编码器、用户历史记忆神经网络与用户动态画像、个性化解码器四个部分具体构成,最终生成用于输出的个性化词语和自动地学习用户的用户画像。最终形成了一个可以从用户对话历史中自动学习隐式用户画像并基于此生成个性化回复的方法以及应用该方法的系统。

    一种时间信息增强的个性化搜索算法

    公开(公告)号:CN112182387A

    公开(公告)日:2021-01-05

    申请号:CN202011049004.0

    申请日:2020-09-29

    发明人: 窦志成 马正一

    摘要: 本发明通过人工智能领域的方法,实现了一种时间信息增强的个性化搜索算法,在输入用户集合基础上,通过循环神经网络得到的原始相关性得分,设计两个时间感知的LSTM结构得到用户的查询意图与文档兴趣的表示为用户的短期兴趣,并利用一个基于查询的以时间为自变量的高斯混合分布,得到为用户的长期查询意图与长期文档兴趣,进而通过个性化排序模块,最终利用神经网络模型同时考虑所述原始相关性得分和所述个性化得分对文档的个性化得分进行最终的计算。通过上述手段,本发明在连续时间空间内对用户兴趣进行建模,从而构建更加准确的用户兴趣表示进而提升个性化排序效果。