-
公开(公告)号:CN111324694B
公开(公告)日:2023-10-10
申请号:CN202010074587.6
申请日:2020-01-22
申请人: 中国人民大学
发明人: 窦志成
IPC分类号: G06F16/33 , G06F16/9535 , G06F40/284 , G06F40/126 , G06N3/0464
摘要: 本发明涉及一种查询查询词推荐系统和方法,包括:查询编码模块、会话编码模块、查询解码模块和查询词推荐模块;查询编码模块,用于每次查询操作中每一个查询词、与其对应的编辑操作和点击行为进行编码;会话编码模块,用于将查询编码模块输出的编码信息和重构向量进行编码,以形成上下文向量;查询解码模块,用于基于上下文向量,预测下一次查询中某查询词和编辑序列中某一行为出现的概率;查询词推荐模块,用于基于下一次查询中某查询词和编辑序列中某一行为出现的概率,推荐查询词。对查询者的重构行为进行描述,并将其加在编码器中,从而形成带有重构信息的上下文编码,能够更全面地了解查询者的意图,并由此预测查询者的下一个查询。
-
公开(公告)号:CN112182387B
公开(公告)日:2023-08-25
申请号:CN202011049004.0
申请日:2020-09-29
申请人: 中国人民大学
IPC分类号: G06F16/9535 , G06F16/9538 , G06N3/049 , G06N3/0442 , G06N3/084
摘要: 本发明通过人工智能领域的方法,实现了一种时间信息增强的个性化搜索方法,在输入用户集合基础上,通过循环神经网络得到的原始相关性得分,设计两个时间感知的LSTM结构得到用户的查询意图与文档兴趣的表示为用户的短期兴趣,并利用一个基于查询的以时间为自变量的高斯混合分布,得到为用户的长期查询意图与长期文档兴趣,进而通过个性化排序模块,最终利用神经网络模型同时考虑所述原始相关性得分和所述个性化得分对文档的个性化得分进行最终的计算。通过上述手段,本发明在连续时间空间内对用户兴趣进行建模,从而构建更加准确的用户兴趣表示进而提升个性化排序效果。
-
公开(公告)号:CN112199481B
公开(公告)日:2023-06-16
申请号:CN202011055601.4
申请日:2020-09-30
申请人: 中国人民大学
IPC分类号: G06F16/332 , G06F16/335 , G06F18/214
摘要: 本发明涉及一种采用PCC对话模型的单用户个性化对话方法和系统,包括以下步骤:1)在用户的对话历史中寻找与当前问题最为匹配的回复,并将最为匹配的回复作为显性指导向量2)对当前问题和历史回复问题进行编码,从而获得当前问题的语义信息和用户兴趣信息,将语义信息和用户兴趣信息通过第一注意力机制结合,得到包含用户兴趣信息的语义向量3)对显性指导信息指导向量用户兴趣信息的语义向量和用户说话风格信息进行解码,再通过第二注意力机制结合当前问题,并通过全连接层生成最终的个性化回复。其在外部加入了搜索模块搜索相似回答作为显性指导,并通过历史发表问题编码了用户历史特征信息,提升了回复的准确性和多样性。
-
公开(公告)号:CN112069399B
公开(公告)日:2023-06-02
申请号:CN202010861245.9
申请日:2020-08-25
申请人: 中国人民大学
IPC分类号: G06F16/9535 , G06F40/284 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明通过人工智能领域的方法,实现了一种基于交互匹配的个性化搜索系统,系统输入模块、基于交互匹配的个性化搜索模块、输出模块,基于交互匹配的个性化搜索模块的运算过程通过用户搜索历史的底层匹配建模、注意力权值的计算、用户兴趣匹配向量的生成、个性化重排序步骤四个步骤,将基于在单词层面将用户的历史查询与候选文档做交互进行匹配的模型思想,注意力机制减少搜索历史中无关信息的影响的思路,使用卷积神经网络对加权后的匹配方法进行融合,从而生成文档最终的兴趣匹配向量,得到更准确的兴趣匹配分,解决了现有基于向量表示的方法下,排序结果的质量依赖向量构建模型的好坏,且构建向量的过程可能会忽略掉一些有用的信息的技术问题。
-
公开(公告)号:CN109597990B
公开(公告)日:2022-11-15
申请号:CN201811396382.9
申请日:2018-11-22
申请人: 中国人民大学
IPC分类号: G06F16/9535 , G06F40/289 , G06F40/295 , G06F16/36 , G06Q30/02
摘要: 本发明涉及一种社会热点与商品品类的匹配方法,其步骤:构建商品品类知识图谱;获取微博热门话题内容;将商品品类知识图谱与热门话题内容进行匹配:对于每一个实时产生的热门话题,获得该话题对应的微博内容,对于其中涉及到的知识图谱中的不同实体,采用不同的匹配方法,将匹配结果在已构建好的知识图谱上进行检索,得到最终的匹配得分;对商品标题与微博内容进行文本匹配;将商品品类知识图谱与热门话题内容的匹配结果与商品标题与微博内容的匹配结果相结合,得到最终的匹配结果。本发明能快速准确地找关联,并及时提供给有需求的店家,丰富店家的商品描述,提高商品销售效率。
-
公开(公告)号:CN114048386A
公开(公告)日:2022-02-15
申请号:CN202111391539.0
申请日:2021-11-23
申请人: 中国人民大学
IPC分类号: G06F16/9535 , G06N3/04 , G06N3/08
摘要: 本发明通过智能搜索领域的方法,实现了一种基于深度学习的融合个性化和多样化的搜索方法。方法主要通过计算一般多样性和个性化多样性的权重、多样性的动态建模、聚合各个得分结果三个步骤,基于深度学习的融合个性化和多样化的搜索模型(DFSPD模型)作为方法的核心,将多样性分为个性化的多样性和一般的多样性来同时考虑个性化和多样化对结果的影响,以根据不同情况提供更令用户满意的结果。本申请方案灵活性非常高,用户描述画像生成器,单词嵌入矩阵和个性化加权过程都可替换,在准确度上有很大的提升。
-
公开(公告)号:CN114036960A
公开(公告)日:2022-02-11
申请号:CN202111429462.1
申请日:2021-11-29
申请人: 中国人民大学
IPC分类号: G06F40/35 , G06F40/284 , G06F16/35 , G06N3/04
摘要: 本发明通过人工智能技术领域的方法,实现了一种多粒度个性化对话生成方法与系统。方案通过用户组识别模块、用户感知的编码器模块、多粒度解码器模块、历史解码器、生成器模块组成。本发明提供的方法可以从用户的对话历史记录中自动提取个性化信息,并使用该信息生成个性化响应。同时,为了充分利用所有对话数据的语义信息,同时避免不同的用户相互干扰。设计了一种多粒度的个性化生成方法。
-
公开(公告)号:CN112990297A
公开(公告)日:2021-06-18
申请号:CN202110262221.6
申请日:2021-03-10
申请人: 北京智源人工智能研究院 , 中国人民大学
IPC分类号: G06K9/62 , G06N3/04 , G06N3/08 , G06F16/583 , G06F16/33
摘要: 本申请提出一种多模态预训练模型的训练方法、应用方法及装置,该方法包括:构建双塔结构的多模态预训练模型;获取包括正样本图文对的正样本数据集和包括负样本图文对的负样本数据集;根据正样本数据集和负样本数据集训练多模态预训练模型,多模态预训练模型包括用于对正样本图文对和负样本图文对进行图文相似度对比学习的跨模态对比学习模块。本申请中多模态预训练模型采用双塔结构和跨模态对比学习算法,对图像和文本模态都构建大量负样本,模型表达能力强,提高了图文对的处理精度。该模型计算图文间的整体相似度,根据相似度判断图文是否对应,基于图文弱相关假设,更贴合实际应用中图文对中图文间语义弱相关的实际情况。
-
公开(公告)号:CN112199481A
公开(公告)日:2021-01-08
申请号:CN202011055601.4
申请日:2020-09-30
申请人: 中国人民大学
IPC分类号: G06F16/332 , G06F16/335 , G06K9/62
摘要: 本发明涉及一种采用PCC对话模型的单用户个性化对话方法和系统,包括以下步骤:1)在用户的对话历史中寻找与当前问题最为匹配的回复,并将最为匹配的回复作为显性指导向量 2)对当前问题和历史回复问题进行编码,从而获得当前问题的语义信息和用户兴趣信息,将语义信息和用户兴趣信息通过第一注意力机制结合,得到包含用户兴趣信息的语义向量 3)对显性指导信息指导向量 用户兴趣信息的语义向量和用户说话风格信息进行解码,再通过第二注意力机制结合当前问题,并通过全连接层生成最终的个性化回复。其在外部加入了搜索模块搜索相似回答作为显性指导,并通过历史发表问题编码了用户历史特征信息,提升了回复的准确性和多样性。
-
公开(公告)号:CN112182162A
公开(公告)日:2021-01-05
申请号:CN202011060198.4
申请日:2020-09-30
申请人: 中国人民大学
IPC分类号: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/04
摘要: 本发明涉及一种基于记忆神经网络的个性化对话方法和系统,包括:S1通过Doc2Vec模型对每条用户历史句子和输入句子进行编码,获得历史句子向量和查询向量;S2根据历史句子向量和查询向量生成情景记忆向量,再将历史句子向量与当前情景记忆向量进行匹配,根据匹配结果更新情景记忆向量,最终利用最新的情景记忆向量生成个性化记忆向量;S3将个性化记忆向量与用户风格向量一同输入至解码器的循环神经网络中,再将解码器与编码器的循环神经网络的输出一同输入注意力机制,使用全连接网络输出最终的个性化回复。其提供了一种直接利用用户对话历史构建个性化对话系统,其对话数据集获取更加方便,更贴近现实中的应用场景。
-
-
-
-
-
-
-
-
-