公共卫生事件检测模型训练方法、检测方法、装置及系统

    公开(公告)号:CN117251726A

    公开(公告)日:2023-12-19

    申请号:CN202311091495.9

    申请日:2023-08-28

    Abstract: 本申请提供公共卫生事件检测模型训练方法、检测方法、装置及系统,方法包括:向智能合约单元发送包含哈希值的即时异步聚合请求,以使该智能合约单元自分布式存储系统中调取隐私保护梯度数据并与全局分类模型进行聚合;基于本地公共卫生事件训练数据对全局模型梯度数据对应的分类模型进行训练,并将训练得到的分类模型对应的梯度数据进行隐私优化,再将得到的隐私保护梯度数据传输至分布式存储系统。本申请能够有效提高公共卫生事件检测模型的训练效率及可靠性,并能够在降低训练过程的计算复杂度的基础上,有效提高训练过程的数据隐私安全性,进而能够有效提高采用公共卫生事件检测模型进行公共卫生事件检测的结果有效性及可靠性。

    联邦变分自编码主题模型训练方法、主题预测方法及装置

    公开(公告)号:CN116578674B

    公开(公告)日:2023-10-31

    申请号:CN202310826329.2

    申请日:2023-07-07

    Abstract: 本申请提供联邦变分自编码主题模型训练方法、主题预测方法及装置,方法包括:在当前的剪枝训练轮次中,接收联邦学习系统中的各个节点各自采用本地的文本训练数据训练得到的局部变分自编码主题模型的模型参数和神经元累计梯度,并对各个局部变分自编码主题模型的模型参数进行聚类以生成目标变分自编码主题模型;基于各个局部变分自编码主题模型的神经元累计梯度对目标变分自编码主题模型进行神经元剪枝处理,得到当前的全局变分自编码主题模型。本申请能够在有效保护本地数据隐私的基础上,能够有效降低模型训练过程的通信和计算开销,能够有效提高采用训练得到的主题模型预测文本数据所属主题类型的预测精度及可靠性。

    基于数据质量评估的强化联邦学习动态采样方法及设备

    公开(公告)号:CN116451593A

    公开(公告)日:2023-07-18

    申请号:CN202310700718.0

    申请日:2023-06-14

    Abstract: 本申请提供一种基于数据质量评估的强化联邦学习动态采样方法及设备,能够根据初始梯度信息构建初始全局模型,并根据初始全局模型的模型性能确定每个客户端的贡献指数,将贡献指数应用到联邦学习的客户端采样中,可以基于贡献指数评估每个客户端的数据质量。然后根据贡献指数和预设的目标精度确定每个客户端的最优动作价值函数值,因为最优动作价值函数综合考虑了模型性能和模型精度,所以根据最优动作价值函数值对预设数量个客户端进行采样,能够有效地在大量参与联邦学习的客户端中智能化地筛选出高数据质量的客户端,利用具有高数据质量的客户端进行强化联邦学习,可以提高联邦学习得到的全局模型的质量和精度。

    基于图卷积网络的科技论文层级多标签分类方法及设备

    公开(公告)号:CN113312480B

    公开(公告)日:2022-12-09

    申请号:CN202110548961.6

    申请日:2021-05-19

    Abstract: 本公开提供一种基于图卷积网络的科技论文层级多标签分类方法及设备,其中方法包括:利用注意力机制在论文与关键词的无向图上进行图形节点嵌入,输出更新后的论文节点特征;将更新后的论文节点特征输入预先训练好的多输出深度神经网络模型中,输出整体的全局标签和局部标签;通过注意力机制组合局部标签和全局标签,组合后的标签经计算处理后得到最终的论文标签分类结果。本公开提供的方法及设备丰富了论文的语义表示,在论文分类中考虑了具有相同关键词的论文之间的关联,使得论文分类更加准确;并且分类过程中每一层仅关注相应层级的标签,减少了每个层需要区分的类别数量,充分获取到不同层级标签的特征,提高了论文分类的准确性。

    基于预训练模型的学术文本语义特征提取方法、系统和存储介质

    公开(公告)号:CN114841173B

    公开(公告)日:2022-11-18

    申请号:CN202210778073.8

    申请日:2022-07-04

    Abstract: 本发明提供一种基于预训练模型的学术文本语义特征提取方法、系统和存储介质,所述方法包括:获取学术资源文本数据;将获得的学术资源文本数据输入至预训练模型,得到多维的学术文本语义特征向量;所述预训练模型是基于多重负样例损失函数对Bert预训练模型进行微调、将微调后的Bert预训练模型作为教师模型通过知识蒸馏来训练学生模型得到的学生预训练模型;将所述多维的学术文本语义特征向量进行降维压缩,输出最终的学术文本语义特征。本发明在提高向量生成质量的同时加快了向量生成的速度,适用于学术大数据场景下的文本向量生成。

    一种基于知识蒸馏的特征提取方法、装置及数据分类方法

    公开(公告)号:CN115309849A

    公开(公告)日:2022-11-08

    申请号:CN202210735762.0

    申请日:2022-06-27

    Abstract: 本发明提供一种基于知识蒸馏的特征提取方法、装置及数据分类方法,所述方法的步骤包括,数据获取,基于网络地址信息获取第一基础数据,存储在预设的数据库中;特征向量获取,将数据库中的第一基础数据分别输入到未训练的学生模型和完成训练的教师模型中,所述学生模型的网络层数量小于教师模型的网络层数量,得到学生模型输出的第一特征向量和教师模型输出的第二特征向量;模型训练,基于第一特征向量和第二特征向量计算损失函数,基于损失函数值优化学生模型中各网络层的参数,得到完成训练的学生模型;特征提取,再次基于网络地址信息获取第二基础数据,将第二基础数据输入完成训练的学生模型得到第三特征向量。

    跨媒体科研资源特征提取模型训练、特征提取方法及装置

    公开(公告)号:CN114818660A

    公开(公告)日:2022-07-29

    申请号:CN202210754761.0

    申请日:2022-06-30

    Abstract: 本申请提供一种跨媒体科研资源特征提取模型训练方法、特征提取方法及装置,训练方法包括:基于跨媒体科研资源数据实时采集系统获取不同媒体来源的科研资源数据并进行数据结构化处理;根据其中的科研资源文本数据对第一深度学习模型进行模型训练及优化,以形成科研资源文本语义特征提取模型;并根据科研资源图像数据对第二深度学习模型进行模型训练及优化,以形成科研资源图像语义特征提取模型。本申请能够专门适用于科研资源数据的语义特征学习,提高跨媒体科研资源数据提取的可靠性、便捷性及有效性,能够提高采用科研资源数据训练后的深度学习模型面向科研资源数据进行特征提取时的表征能力,提高提取结果的全面性、多样性、准确性及可靠性。

    跨媒体大数据的公共语义表示、搜索方法和装置

    公开(公告)号:CN110781319B

    公开(公告)日:2022-06-21

    申请号:CN201910877850.2

    申请日:2019-09-17

    Abstract: 本发明公开了一种跨媒体大数据的公共语义表示、搜索方法和装置,所述方法包括:提取大数据中图像、文本的全局语义特征和局部显著性深度语义特征;确定所述图像和文本的全局语义特征相似性,以及所述图像和文本的局部显著性语义特征相似性;联合所述图像和文本的全局和局部显著性语义特征相似性进行跨媒体语义关联学习,获得跨媒体大数据的公共语义表示。应用本发明能够增强跨媒体关联学习能力,发现潜在的细粒度跨媒体语义关联,从而提高跨媒体大数据的搜索精准度。

    一种表情识别及课堂状态评估方法、设备及介质

    公开(公告)号:CN113239916B

    公开(公告)日:2021-11-30

    申请号:CN202110787831.8

    申请日:2021-07-13

    Inventor: 梁美玉 陈徵 薛哲

    Abstract: 本公开提供一种表情识别及课堂状态评估方法、设备及存储介质,表情识别方法包括:获取目标对象的图像序列;将图像序列输入训练好的表情识别模型进行识别,得到目标对象的表情识别结果;训练好的表情识别模型包括:时空特征网络,对图像序列进行特征提取,得到时空特征序列;时空注意力网络,用于对时空特征序列进行空间注意力特征学习和时间注意力特征学习,得到表情特征序列;分类网络,用于对表情特征序列进行分类得到表情识别结果。根据本公开,提高了表情识别的准确度。在精确识别表情的基础上进行课堂状态评估,增强最终课堂评估结果的客观性、全面性以及正确性。

Patent Agency Ranking