一种结合联邦学习与用户画像的个性化模型训练方法及系统

    公开(公告)号:CN112329940A

    公开(公告)日:2021-02-05

    申请号:CN202011204582.7

    申请日:2020-11-02

    Abstract: 本发明公开了一种结合联邦学习与用户画像的个性化模型训练方法及系统,所述方法的具体实施包括:每个参与方将私有数据输入到模型中,在本地进行训练,获得本地模型,将模型中待聚合参数加密发送至中心服务器;中心服务器根据各个参与方发送的待聚合参数,计算每个参与方的贡献度,并根据结果更新聚合后的模型参数,下发至各个参与方;每个参与方根据服务器下发的参数及本地个性化参数更新本地模型。该方法涉及机器学习领域,结合联邦学习和用户画像,无需上传用户数据即可联合多方资源实现个性化的模型训练,解决现有技术中对用户隐私保护和个性化模型设置不能兼顾的问题。

    一种融合深度图像分类和检索的智能台风定强方法

    公开(公告)号:CN110751209A

    公开(公告)日:2020-02-04

    申请号:CN201910996243.8

    申请日:2019-10-18

    Abstract: 本发明提出了一种融合深度图像分类和检索的智能台风定强方法,用以从有限的不均衡的卫星遥感数据中自动获取台风强度特征,并结合特征分类和特征检索双估计方法进行台风定强,解决台风强度预测误差大且泛化能力、可解释性差的问题。所述的台风定强方法包括:从卫星遥感数据中获取台风图像;训练深度卷积网络CNN模型、提取特征、构建特征检索库;使用训练好CNN模型对待测台风图像进行强度分类;采用向量距离检索模型对待测台风图像进行相似度检索;对分类和检索结果进行排序策略融合,得到最终的台风强度。

    知识图谱预测的方法和装置

    公开(公告)号:CN107391512A

    公开(公告)日:2017-11-24

    申请号:CN201610324506.7

    申请日:2016-05-17

    CPC classification number: G06F17/30864 G06F17/15 G06Q10/04

    Abstract: 本发明实施例提供了一种知识图谱预测的方法和装置,包括:获取第一实体和第二实体;根据所述第一实体和所述第二实体,建立第一三角子图;根据所述第一三角子图和嵌入式模型,确定所述第一实体和所述第二实体之间的关系。本发明实施例获取第一实体和第二实体,并建立包含该第一实体和第二实体的三角子图,根据该三角子图和嵌入式模型,确定该第一实体和第二实体之间的关系。本发明实施例能够充分利用知识图谱中三角子图在语义层面上的关系类型,获取对象实体相互之间的关联性,从而避免了仅考虑实体对的直接语义相关性导致的数据稀疏的问题。

    一种基于嵌入式表示的自适应中文分词方法

    公开(公告)号:CN107145483A

    公开(公告)日:2017-09-08

    申请号:CN201710269840.1

    申请日:2017-04-24

    CPC classification number: G06F17/2775 G06N3/04

    Abstract: 本发明实施例公开了一种基于嵌入式表示的自适应中文分词方法。属于信息处理领域。该方法的特征包括:分词网络和字符语言模型共享一个字符的嵌入式表示层。字符的嵌入式表示,一方面通过基于卷积神经网络的分词网络,得到待分词文本的隐多粒度局部特征;再经过一个前向网络层,得到字符的标签概率;最后应用标签推断,得到句子级别上的最优分词结果。另一方面,我们随机抽取未标注的文本,通过一个基于长短期记忆单元(LSTM)循环神经网络的字符语言模型,预测该字符下一个位置的字符,对分词网络进行约束;本发明通过字符语言模型建模中文不同领域文本中的字符共现关系,并通过嵌入式表示将信息传递给分词网络,使得分词的领域迁移能力得到提升,具有很大的实用价值。

    建模对话轮次信息的检索式闲聊对话打分方法

    公开(公告)号:CN110309287B

    公开(公告)日:2021-07-06

    申请号:CN201910612036.8

    申请日:2019-07-08

    Abstract: 本发明提供了一种引入对话历史信息的局部注意力机制的检索式对话系统,在开放领域的检索式对话中,传统的模型分为表示层,匹配层,集成层,预测层中,最后从候选集中选出和对话最匹配的候选回复。将表示层划分成单句表示和句间关系两部分进行分别建模。在建模对话的轮次信息时使用局部注意力机制,使得在训练模型时,注意力机制能够获得对于匹配任务更有帮助的轮次信息。局部注意力机制也能够提高模型对整个对话中不同位置内容的关注能力。针对对话中的每部分内容,对重要信息赋予较大权重,次要信息或干扰信息赋予较小权重,实现更好的回复匹配,加快训练速度,提高模型效率。

    知识图谱预测的方法和装置

    公开(公告)号:CN107391512B

    公开(公告)日:2021-05-11

    申请号:CN201610324506.7

    申请日:2016-05-17

    Abstract: 本发明实施例提供了一种知识图谱预测的方法和装置,包括:获取第一实体和第二实体;根据所述第一实体和所述第二实体,建立第一三角子图;根据所述第一三角子图和嵌入式模型,确定所述第一实体和所述第二实体之间的关系。本发明实施例获取第一实体和第二实体,并建立包含该第一实体和第二实体的三角子图,根据该三角子图和嵌入式模型,确定该第一实体和第二实体之间的关系。本发明实施例能够充分利用知识图谱中三角子图在语义层面上的关系类型,获取对象实体相互之间的关联性,从而避免了仅考虑实体对的直接语义相关性导致的数据稀疏的问题。

    一种基于深度多相似度哈希的多标签图像检索方法

    公开(公告)号:CN108256082A

    公开(公告)日:2018-07-06

    申请号:CN201810058388.9

    申请日:2018-01-22

    Abstract: 本发明公开了一种基于深度多相似度哈希的图像检索方法、装置、电子设备及存储介质,其中图像索引方法主要包括:使用二值化编码作为图像索引值的图像检索系统;其中,使用预训练的卷积神经网络对图像内容进行二值化编码,二值化编码的汉明距离可以表征图像内容的相似度;其中,卷积神经网络使用量化损失和图像对损失共同构成的复合损失函数作为监督,在大规模多标签图像数据集上充分训练。本发明通过引入量化损失函数,使用卷积神经网络对图像内容进行二值化编码;引入图像对损失函数作为监督训练卷积神经网络,使得对图像内容的理解程度提升至标签语义级别,具有很大的实用价值。

    一种基于词典和seq2seq预训练机制的中医古籍翻译方法

    公开(公告)号:CN109740169B

    公开(公告)日:2020-10-13

    申请号:CN201910020459.0

    申请日:2019-01-09

    Abstract: 本发明公开了一种基于词典和seq2seq预训练机制的中医典籍古文翻译方法,属于信息处理领域。该方法的特征包括:先预训练一个通用的seq2seq古文翻译模型,再基于词典,在中医专业知识的指导下,训练针对中医典籍的古文翻译模型。具体特征为:编码器和中医专业知识编码器分别用循环神经网络将古文编码得到内容向量,中医专业知识编码得到专业向量;将内容向量作为另一个循环神经网络的初始参数,输入特定开始字符,开始解码;将上一时刻解码器的输出、内容向量、专业向量拼接作为下一时刻解码器的输入,直至解码器输出结束符。本发明通过预训练通用的seq2seq古文翻译模型,并基于词典,在中医专业知识的指导下对中医典籍古文翻译进行优化,取得了很好的应用效果。

    一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法

    公开(公告)号:CN109740168B

    公开(公告)日:2020-10-13

    申请号:CN201910019916.4

    申请日:2019-01-09

    Abstract: 本发明公开了一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法,属于信息处理领域。该方法的特征包括:基于注意力机制,用中医药知识图谱指导训练attention‑seq2seq中医典籍古文翻译模型。具体特征为:根据中医药知识图谱,将中医专业知识编码成图谱向量,用循环神经网络将中医古文编码得到古文向量;将古文向量作为另一个循环神经网络的初始参数,输入特定开始字符,开始解码;将上一时刻解码器的输出经过Attention模块得到attention向量,attention向量和图谱向量一起得到指导向量。指导向量和上一时刻的输出拼接作为下一时刻解码器的输入,直至解码器输出结束符。本发明通过中医药知识图谱引入了大量专业中医知识指导attention‑seq2seq模型,取得了很好的应用效果。

    一种基于策略价值网络和树搜索增强的命名实体识别方法

    公开(公告)号:CN110209770A

    公开(公告)日:2019-09-06

    申请号:CN201910478860.9

    申请日:2019-06-03

    Abstract: 本发表公开了一种基于策略价值网络的命名实体识别方法,属于信息处理领域。该方法首先将命名实体识别的标注过程建模成马尔科夫决策过程(MDP),提出了一种新颖的基于强化学习的命名实体识别模型,称为MM-NER。MM-NER是第一个将将蒙特卡洛树搜索(MCTS)增强型MDP模型应用于命名实体识别(序列标记任务)的工作。它基于MDP状态定义设计了一个策略价值网络来获得标签概率和标注序列准确度评估,并利用MCTS进行模拟,进而搜索出一个更具全局意识的标注序列。在推断过程,直接使用策略价值网络可以保证识别效果与树搜索策略基本一致,并大大降低时间复杂度。本发明在CoNLL2003命名实体识别数据集上的实验结果,证明了拥有K步探索决策机制的MM-NER的有效性。

Patent Agency Ranking