一种基于跨粒度联合训练的图对比表征学习方法及系统

    公开(公告)号:CN114943016A

    公开(公告)日:2022-08-26

    申请号:CN202210690197.0

    申请日:2022-06-17

    Applicant: 吉林大学

    Abstract: 本发明公开一种基于跨粒度联合训练的图对比表征学习方法及系统,涉及图对比表征学习技术领域,包括:根据训练图数据得到节点级特征和图级特征;根据节点级特征和图级特征得到融合特征;根据融合特征和邻接矩阵得到融合图数据;分别采用第一扰动方案和第二扰动方案对融合图数据进行扰动,得到第一扰动后的融合图数据和第二扰动后的融合图数据;利用第一扰动后的融合图数据和第二扰动后的融合图数据对图学习模型进行训练和优化,得到优化后的图学习模型;将待表征学习图数据对应的第一扰动后的融合图数据和第二扰动后的融合图数据输入优化后的图学习模型中,得到待表征学习图数据对应的第一特征向量和第二特征向量。本发明能提取出更有效的图表征。

    一种基于预测误差的可逆数据隐藏方法及系统

    公开(公告)号:CN112333348B

    公开(公告)日:2021-08-24

    申请号:CN202011154309.8

    申请日:2020-10-26

    Applicant: 吉林大学

    Abstract: 本发明涉及一种基于预测误差的可逆数据隐藏方法及系统,所述方法包括:对图像进行分区,得到阴影部分和空白部分;对所述阴影部分进行第一层嵌入处理;对所述空白部分进行多层嵌入处理;提取所述多层嵌入处理后的空白部分的最外层信息;提取所述第一层嵌入处理后的阴影部分的信息。本发明中的上述方法能够有效解决大容量数据嵌入的时候图像失真的问题。

    一种基于预测误差的可逆数据隐藏方法及系统

    公开(公告)号:CN112333348A

    公开(公告)日:2021-02-05

    申请号:CN202011154309.8

    申请日:2020-10-26

    Applicant: 吉林大学

    Abstract: 本发明涉及一种基于预测误差的可逆数据隐藏方法及系统,所述方法包括:对图像进行分区,得到阴影部分和空白部分;对所述阴影部分进行第一层嵌入处理;对所述空白部分进行多层嵌入处理;提取所述多层嵌入处理后的空白部分的最外层信息;提取所述第一层嵌入处理后的阴影部分的信息。本发明中的上述方法能够有效解决大容量数据嵌入的时候图像失真的问题。

    训练医疗数据生成模型的方法、医疗数据生成方法及设备

    公开(公告)号:CN117976230A

    公开(公告)日:2024-05-03

    申请号:CN202410129247.7

    申请日:2024-01-31

    Applicant: 吉林大学

    Abstract: 本发明公开一种训练医疗数据生成模型的方法、医疗数据生成方法及设备,涉及医疗数据生成技术领域,方法包括:将真实医疗数据和预测医疗数据输入判别器,并结合判别器损失函数计算梯度值;计算当前累积信息泄露量,并据此计算当前需要分配的隐私预算;根据隐私预算和梯度值确定噪声扰动;根据噪声扰动更新判别器参数再更新生成器参数;最后根据已分配的隐私预算确定是否停止迭代,从而得到医疗数据生成模型,本发明提出了一种根据信息泄露灵活分配隐私预算的差分隐私方法,在保护了训练数据隐私的同时,合理分配隐私预算,提高生成医疗数据的可用性。

    一种基于半监督-迁移学习的分布式隐私保护方法及系统

    公开(公告)号:CN114927190B

    公开(公告)日:2024-12-24

    申请号:CN202210691080.4

    申请日:2022-06-17

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于半监督‑迁移学习的分布式隐私保护方法及系统,涉及医疗大数据技术领域,该方法包括:构建分布式模型;以标注好疾病类别的图像数据集为输入对分布式模型中的教师模型进行训练,得到训练好的教师模型;将未标注疾病类别的图像数据集输入至训练好的教师模型得到疾病类别数据集;对多个训练好的教师模型输出的疾病类别数据集进行加密处理确定参考疾病类别数据集;以未标注疾病类别的图像数据集为输入,以参考疾病类别数据集为输出,对分布式模型中的学生模型进行训练得到训练好的学生模型;将待诊断疾病类别的图像数据输入训练好的学生模型得到待诊断疾病的疾病类别。本发明能够增强分布式技术的隐私保护性能。

    一种基于联邦学习的数据增强方法及系统

    公开(公告)号:CN118821869A

    公开(公告)日:2024-10-22

    申请号:CN202410972972.0

    申请日:2024-07-19

    Applicant: 吉林大学

    Abstract: 本申请公开了一种基于联邦学习的数据增强方法及系统,涉及数据处理技术领域,该方法包括:根据各边缘节点的距离,将与中心服务器连接的所有边缘节点划分为多个边缘组,各边缘组中任意两个边缘节点之间的距离小于设定距离阈值;中心服务器部署有全局模型,各边缘节点均部署有本地模块,全局模型和各本地模块均为生成对抗网络;采用各边缘节点的本地数据对全局模型进行联邦学习,得到各边缘节点训练好的本地模型;联邦学习的每轮全局训练时,随机选择一个边缘组与中心服务器进行全局模型训练;采用各边缘节点的训练好的本地模型进行本地数据增强;训练好的本地模型用于根据输入的原始图像输出新的样本图像。本申请提高了数据增强的有效性。

    一种基于半监督-迁移学习的分布式隐私保护方法及系统

    公开(公告)号:CN114927190A

    公开(公告)日:2022-08-19

    申请号:CN202210691080.4

    申请日:2022-06-17

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于半监督‑迁移学习的分布式隐私保护方法及系统,涉及医疗大数据技术领域,该方法包括:构建分布式模型;以标注好疾病类别的图像数据集为输入对分布式模型中的教师模型进行训练,得到训练好的教师模型;将未标注疾病类别的图像数据集输入至训练好的教师模型得到疾病类别数据集;对多个训练好的教师模型输出的疾病类别数据集进行加密处理确定参考疾病类别数据集;以未标注疾病类别的图像数据集为输入,以参考疾病类别数据集为输出,对分布式模型中的学生模型进行训练得到训练好的学生模型;将待诊断疾病类别的图像数据输入训练好的学生模型得到待诊断疾病的疾病类别。本发明能够增强分布式技术的隐私保护性能。

    一种关键词提取方法、计算设备及可读存储介质

    公开(公告)号:CN111985217B

    公开(公告)日:2022-08-02

    申请号:CN202010941205.5

    申请日:2020-09-09

    Applicant: 吉林大学

    Abstract: 本发明公开了一种关键词提取方法,在计算设备中执行,包括以下步骤:获取待提取关键词的文本,该文本中包括多个候选词;对于每一个候选词:分别确定该候选词与其他候选词的相似度,将该候选词与其他候选词的相似度的和作为该候选词的覆盖率;根据该候选词在文本中的位置来确定该候选词的位置特征值:确定该候选词的主题概率分布,将概率的最大值作为该候选词的语义多样性;根据覆盖率、位置特征值、语义多样性来确定该候选词的综合特征值;将综合特征值最大的预设数量个候选词作为文本的关键词。本发明一并公开了相应的计算设备。

    一种关键词提取方法及计算设备

    公开(公告)号:CN111985217A

    公开(公告)日:2020-11-24

    申请号:CN202010941205.5

    申请日:2020-09-09

    Applicant: 吉林大学

    Abstract: 本发明公开了一种关键词提取方法,在计算设备中执行,包括以下步骤:获取待提取关键词的文本,该文本中包括多个候选词;对于每一个候选词:分别确定该候选词与其他候选词的相似度,将该候选词与其他候选词的相似度的和作为该候选词的覆盖率;根据该候选词在文本中的位置来确定该候选词的位置特征值:确定该候选词的主题概率分布,将概率的最大值作为该候选词的语义多样性;根据覆盖率、位置特征值、语义多样性来确定该候选词的综合特征值;将综合特征值最大的预设数量个候选词作为文本的关键词。本发明一并公开了相应的计算设备。

Patent Agency Ranking