一种结合联邦学习与用户画像的个性化模型训练方法及系统

    公开(公告)号:CN112329940A

    公开(公告)日:2021-02-05

    申请号:CN202011204582.7

    申请日:2020-11-02

    IPC分类号: G06N20/00

    摘要: 本发明公开了一种结合联邦学习与用户画像的个性化模型训练方法及系统,所述方法的具体实施包括:每个参与方将私有数据输入到模型中,在本地进行训练,获得本地模型,将模型中待聚合参数加密发送至中心服务器;中心服务器根据各个参与方发送的待聚合参数,计算每个参与方的贡献度,并根据结果更新聚合后的模型参数,下发至各个参与方;每个参与方根据服务器下发的参数及本地个性化参数更新本地模型。该方法涉及机器学习领域,结合联邦学习和用户画像,无需上传用户数据即可联合多方资源实现个性化的模型训练,解决现有技术中对用户隐私保护和个性化模型设置不能兼顾的问题。

    一种融合深度图像分类和检索的智能台风定强方法

    公开(公告)号:CN110751209A

    公开(公告)日:2020-02-04

    申请号:CN201910996243.8

    申请日:2019-10-18

    IPC分类号: G06K9/62

    摘要: 本发明提出了一种融合深度图像分类和检索的智能台风定强方法,用以从有限的不均衡的卫星遥感数据中自动获取台风强度特征,并结合特征分类和特征检索双估计方法进行台风定强,解决台风强度预测误差大且泛化能力、可解释性差的问题。所述的台风定强方法包括:从卫星遥感数据中获取台风图像;训练深度卷积网络CNN模型、提取特征、构建特征检索库;使用训练好CNN模型对待测台风图像进行强度分类;采用向量距离检索模型对待测台风图像进行相似度检索;对分类和检索结果进行排序策略融合,得到最终的台风强度。

    知识图谱预测的方法和装置

    公开(公告)号:CN107391512A

    公开(公告)日:2017-11-24

    申请号:CN201610324506.7

    申请日:2016-05-17

    IPC分类号: G06F17/30 G06Q10/04 G06F17/15

    摘要: 本发明实施例提供了一种知识图谱预测的方法和装置,包括:获取第一实体和第二实体;根据所述第一实体和所述第二实体,建立第一三角子图;根据所述第一三角子图和嵌入式模型,确定所述第一实体和所述第二实体之间的关系。本发明实施例获取第一实体和第二实体,并建立包含该第一实体和第二实体的三角子图,根据该三角子图和嵌入式模型,确定该第一实体和第二实体之间的关系。本发明实施例能够充分利用知识图谱中三角子图在语义层面上的关系类型,获取对象实体相互之间的关联性,从而避免了仅考虑实体对的直接语义相关性导致的数据稀疏的问题。

    一种基于嵌入式表示的自适应中文分词方法

    公开(公告)号:CN107145483A

    公开(公告)日:2017-09-08

    申请号:CN201710269840.1

    申请日:2017-04-24

    IPC分类号: G06F17/27 G06N3/04

    CPC分类号: G06F17/2775 G06N3/04

    摘要: 本发明实施例公开了一种基于嵌入式表示的自适应中文分词方法。属于信息处理领域。该方法的特征包括:分词网络和字符语言模型共享一个字符的嵌入式表示层。字符的嵌入式表示,一方面通过基于卷积神经网络的分词网络,得到待分词文本的隐多粒度局部特征;再经过一个前向网络层,得到字符的标签概率;最后应用标签推断,得到句子级别上的最优分词结果。另一方面,我们随机抽取未标注的文本,通过一个基于长短期记忆单元(LSTM)循环神经网络的字符语言模型,预测该字符下一个位置的字符,对分词网络进行约束;本发明通过字符语言模型建模中文不同领域文本中的字符共现关系,并通过嵌入式表示将信息传递给分词网络,使得分词的领域迁移能力得到提升,具有很大的实用价值。

    一种基于词典和seq2seq预训练机制的中医古籍翻译方法

    公开(公告)号:CN109740169B

    公开(公告)日:2020-10-13

    申请号:CN201910020459.0

    申请日:2019-01-09

    摘要: 本发明公开了一种基于词典和seq2seq预训练机制的中医典籍古文翻译方法,属于信息处理领域。该方法的特征包括:先预训练一个通用的seq2seq古文翻译模型,再基于词典,在中医专业知识的指导下,训练针对中医典籍的古文翻译模型。具体特征为:编码器和中医专业知识编码器分别用循环神经网络将古文编码得到内容向量,中医专业知识编码得到专业向量;将内容向量作为另一个循环神经网络的初始参数,输入特定开始字符,开始解码;将上一时刻解码器的输出、内容向量、专业向量拼接作为下一时刻解码器的输入,直至解码器输出结束符。本发明通过预训练通用的seq2seq古文翻译模型,并基于词典,在中医专业知识的指导下对中医典籍古文翻译进行优化,取得了很好的应用效果。

    一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法

    公开(公告)号:CN109740168B

    公开(公告)日:2020-10-13

    申请号:CN201910019916.4

    申请日:2019-01-09

    摘要: 本发明公开了一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法,属于信息处理领域。该方法的特征包括:基于注意力机制,用中医药知识图谱指导训练attention‑seq2seq中医典籍古文翻译模型。具体特征为:根据中医药知识图谱,将中医专业知识编码成图谱向量,用循环神经网络将中医古文编码得到古文向量;将古文向量作为另一个循环神经网络的初始参数,输入特定开始字符,开始解码;将上一时刻解码器的输出经过Attention模块得到attention向量,attention向量和图谱向量一起得到指导向量。指导向量和上一时刻的输出拼接作为下一时刻解码器的输入,直至解码器输出结束符。本发明通过中医药知识图谱引入了大量专业中医知识指导attention‑seq2seq模型,取得了很好的应用效果。

    一种基于策略价值网络和树搜索增强的命名实体识别方法

    公开(公告)号:CN110209770A

    公开(公告)日:2019-09-06

    申请号:CN201910478860.9

    申请日:2019-06-03

    IPC分类号: G06F16/33 G06F16/36

    摘要: 本发表公开了一种基于策略价值网络的命名实体识别方法,属于信息处理领域。该方法首先将命名实体识别的标注过程建模成马尔科夫决策过程(MDP),提出了一种新颖的基于强化学习的命名实体识别模型,称为MM-NER。MM-NER是第一个将将蒙特卡洛树搜索(MCTS)增强型MDP模型应用于命名实体识别(序列标记任务)的工作。它基于MDP状态定义设计了一个策略价值网络来获得标签概率和标注序列准确度评估,并利用MCTS进行模拟,进而搜索出一个更具全局意识的标注序列。在推断过程,直接使用策略价值网络可以保证识别效果与树搜索策略基本一致,并大大降低时间复杂度。本发明在CoNLL2003命名实体识别数据集上的实验结果,证明了拥有K步探索决策机制的MM-NER的有效性。

    一种基于词典和seq2seq预训练机制的中医古籍翻译方法

    公开(公告)号:CN109740169A

    公开(公告)日:2019-05-10

    申请号:CN201910020459.0

    申请日:2019-01-09

    IPC分类号: G06F17/28 G06F17/27 G06N3/04

    摘要: 本发明公开了一种基于词典和seq2seq预训练机制的中医典籍古文翻译方法,属于信息处理领域。该方法的特征包括:先预训练一个通用的seq2seq古文翻译模型,再基于词典,在中医专业知识的指导下,训练针对中医典籍的古文翻译模型。具体特征为:编码器和中医专业知识编码器分别用循环神经网络将古文编码得到内容向量,中医专业知识编码得到专业向量;将内容向量作为另一个循环神经网络的初始参数,输入特定开始字符,开始解码;将上一时刻解码器的输出、内容向量、专业向量拼接作为下一时刻解码器的输入,直至解码器输出结束符。本发明通过预训练通用的seq2seq古文翻译模型,并基于词典,在中医专业知识的指导下对中医典籍古文翻译进行优化,取得了很好的应用效果。

    一种基于神经网络推理的中文缺失代词补全方法

    公开(公告)号:CN109492223A

    公开(公告)日:2019-03-19

    申请号:CN201811313974.X

    申请日:2018-11-06

    IPC分类号: G06F17/27 G06N3/04 G06N5/04

    摘要: 本发明公开了一种中文缺失代词补全方法,属于信息处理领域,该方法的特征包括:构建输入文本矩阵;循环神经网络形成输入文本语义信息矩阵;构建输入文本上下文文本矩阵;循环神经网络形成句子层面、词语层面两个输入文本上下文语义信息矩阵;利用神经网络推理得到输入文本上下文句子层面各句子重要程度的注意力权重;更新得到上下文句子层面语义信息矩阵;将结果融合输入文本矩阵得到输入文本推理信息矩阵;利用神经网络推理得到输入文本上下文词语层面各句子重要程度的注意力权重;更新得到上下文词语层面语义信息矩阵;融合得到最终输入文本的推理信息矩阵;通过多层感知器得到各词语的缺失代词概率分布;预测输入文本各词语缺失代词类型。