一种基于用户对话历史的个性化对话生成方法和系统

    公开(公告)号:CN112182161A

    公开(公告)日:2021-01-05

    申请号:CN202011060186.1

    申请日:2020-09-30

    发明人: 窦志成 文继荣

    摘要: 本发明涉及一种基于用户对话历史的个性化对话生成方法和系统,包括以下步骤:S1将用户对话历史的文本表示为句子向量;S2通过对句子向量进行编码得到用户个性向量,用户个性向量中包含了句子向量的时序信息;S3根据用户个性向量和句子向量的时序信息生成个性化对话模型;S4将新的输入文本的词向量输入个性化对话模型生成个性化对话的回复。其使用对话历史进行用户建模,通过用户对话历史回复计算得出用户个性向量,而避免使用用户ID获取和更新个性向量,当新用户加入时,即可直接将其对话历史表示为个性向量。

    一种基于长短时记忆信息的个性化对话生成方法和系统

    公开(公告)号:CN112115247A

    公开(公告)日:2020-12-22

    申请号:CN202010927235.0

    申请日:2020-09-07

    发明人: 窦志成 李小禾

    摘要: 本发明涉及一种基于长短时记忆信息的个性化对话生成方法和系统,包括以下步骤:将输入文本和用户对话历史的文本表示为句子向量;将输入文本进行编码获得感知记忆信息;在用户对话历史的文本中筛选出与输入文本最相似的历史作为当前输入下用户的长时记忆,将长时记忆进行编码得到长时记忆信息;将与输入文本时间上最为接近的用户对话历史进行编码得到用户的短时记忆信息;将感知记忆信息、长时记忆信息和短时记忆信息在每个生成时刻更新并与之前时刻的输出信息一同进行解码,从而生成具有用户个性的对话。其针对不同内容和不同时刻的输入区别对待对话历史,提供不同维度的记忆信息作为动态的隐式人设,生成结果更加符合真实对话场景。

    基于记忆网络的个性化搜索方法及系统

    公开(公告)号:CN111310023A

    公开(公告)日:2020-06-19

    申请号:CN202010042175.4

    申请日:2020-01-15

    发明人: 窦志成 文继荣

    摘要: 本发明涉及一种基于记忆网络的个性化搜索方法及系统,该方法的具体过程为:S1、基于记忆网络,根据用户当前需求从查询内存和文档内存中动态寻找相关的历史行为;S2、基于记忆网络,从意图内存中寻找与查询和文档相关的会话信息;S3、根据历史信息和会话信息,预测每一个候选文档被点击的概率,并结合文档与查询的相关性,完成候选文档的个性化重排。本发明针对用户搜索行为中的重查行为,使用记忆网络来存储完善的用户信息,从而强化重查行为的识别与影响力,进而改善个性化搜索结果。

    一种基于深度匹配模型的跨平台商品匹配方法

    公开(公告)号:CN109584006A

    公开(公告)日:2019-04-05

    申请号:CN201811423859.8

    申请日:2018-11-27

    IPC分类号: G06Q30/06 G06N3/04

    CPC分类号: G06Q30/0629 G06N3/0454

    摘要: 本发明涉及一种基于深度匹配模型的商品匹配方法,其包括以下步骤:定义两个商品X、Y的标题相似度和属性相似度;计算得到两个商品X、Y的商品标题相似度和商品属性相似度;将两个商品X、Y的商品标题相似度SIMt和商品属性相似度SIMa进行融合,进而判断出两个商品是否匹配,是否属于同一种商品。本发明能计算出不同平台的两个商品的相似度,从而判断出这两个商品描述是否指的是同一个商品。

    一种基于知识库的查询分面生成方法

    公开(公告)号:CN105550226A

    公开(公告)日:2016-05-04

    申请号:CN201510888652.8

    申请日:2015-12-07

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30864 G06F17/30389

    摘要: 本发明公开了一种基于知识库的查询分面生成方法,该方法包括如下步骤:1)对于给定查询q,从搜索引擎中获取前T个检索结果,组成查询结果集合D;2)基于QDMiner算法获取一系列初始查询分面f,一系列所述初始查询分面f组成集合F;3)对每一个所述初始查询分面f进行扩展;4)对扩展后的所述初始查询分面f利用检索文档进行过滤,以保证扩展结果的准确率;利用扩展之后的初始查询分面f生成最终的查询分面。本发明使用知识库生成查询分面,可以有效解决现有方法依赖于检索结果的局限性。通过利用知识库中高质量的信息对初始分面进行扩展,检索结果中没有出现或未被抽取的分面词项可以被准确定位,从而提高查询分面的准确性和覆盖率。

    一种利用个人词向量消除关键词歧义的个性化搜索模型

    公开(公告)号:CN112182154B

    公开(公告)日:2023-10-10

    申请号:CN202011021940.0

    申请日:2020-09-25

    摘要: 本发明通过人工智能领域的方法,实现了一种利用个人词向量消除关键词歧义的个性化搜索模型,包括预训练词向量模块、个性化排序模型、在线更新模块三部分。通过为每个用户设置用户个人的词向量矩阵,得到查询和文档的个性化词向量表示,再通过注意力机制获得查询和文档的上下文表示以及基于会话的查询意图表示。然后,通过搭建一个多任务框架,利用个性化排序和查询重构两个任务来联合训练个人词向量和排序模型。并且为使个人词向量包含用户的最新兴趣,设计三种在线调整词向量的方法。通过上述手段,实现了直接计算查询和文档个性化表示的匹配得分、帮助消除查询关键词的歧义、明确用户的查询意图、提高计算文档个性化得分效率的技术效果。

    一种基于语义表示的个性化检索式对话方法和系统

    公开(公告)号:CN112182159B

    公开(公告)日:2023-07-07

    申请号:CN202011055580.6

    申请日:2020-09-30

    摘要: 本发明涉及一种基于语义表示的个性化检索式对话方法和系统,包括以下步骤:S1从用户发言历史语句集中抽取出个性化特征语句p;S2根据用户给出的输入语句q,结合个性化特征语句p,在预建立的对话集中检索,并将检索结果生成候选集C;S3将候选集C中的所有候选回复r={r1,r2,...,rn}与用户输入语句q、个性化特征语句p进行语句匹配,得到每个候选回复ri的语句匹配得分score(q,p,ri);S4将候选回复ri的语句匹配得分进行排序,并选出得分最高的候选回复作为最终的个性化回复。其针对社交媒体平台的开放域对话系统,个性化对话数据更易获得,数据可扩展性强。

    一种基于联邦学习增强隐私保护的个性化搜索系统

    公开(公告)号:CN112507219B

    公开(公告)日:2023-06-02

    申请号:CN202011415365.2

    申请日:2020-12-07

    摘要: 本发明通过人工智能领域的方法,实现了一种基于联邦学习增强隐私保护的个性化搜索系统,系统的硬件架构由客户端和服务器构成,并构建基于联邦学习的个性化搜索框架,其中具体训练的底层模型为个性化排序模型,通过联邦学习的方式共同参与个性化排序模型的训练,训练得到的模型部署在各个客户端上,在客户端上发起查询、存储用户的搜索历史H、构建用户画像P,对从服务器返回的非个性化结果进行重排后展示给用户。解决了在利用用户的查询历史挖掘用户兴趣来推断当前的查询意图时,保护用户隐私的问题;并且基于这个框架,设计了两种模型,FedPSFlat和FedPSProxy,解决数据异质性的问题,以及单层FedPSFlat面临的性能瓶颈、通信障碍和隐私攻击的问题。

    一种基于自注意力网络的搜索结果多样化方法

    公开(公告)号:CN112182439B

    公开(公告)日:2023-05-23

    申请号:CN202011055076.6

    申请日:2020-09-30

    发明人: 窦志成 秦绪博

    IPC分类号: G06F16/9538 G06N3/084

    摘要: 本发明通过人工智能领域的方法,实现了一种基于自注意力网络的搜索结果多样化方法,采用重排序模型,通过将模型设置编码器和解码器构成的编码器‑解码器结构以及排序学习函数,经过训练步骤后,针对输入的查询和子话题进行运算,最终生成经过多样化重排序的文档序列。通过上述步骤,建立了一个基于自注意力网络的模型结构,捕获候选文档间的全局交互信息;编码器‑解码器结构同时捕获文档本身相对于其他文档的新颖性,以及文档对不同子话题的覆盖程度,并综合考量文档的相关性特征以获得最终的多样化排序评分,并克服现有选择算法难以获得全局最优解的局限性的问题。