-
公开(公告)号:CN118364234A
公开(公告)日:2024-07-19
申请号:CN202410555817.9
申请日:2024-05-07
IPC分类号: G06F18/15 , G06F18/241 , G06N3/0464 , G06N3/08 , G06N3/0895
摘要: 本发明公开了一种多视角缺失数据补全方法及装置、电子设备、存储设备,包括:获取多视角缺失数据样本、标签样本及掩码样本,构建视角块信息矩阵、标签矩阵和缺失掩码矩阵;根据视角块缺失掩码矩阵对信息矩阵进行实例归一化;构建基于生成对抗网络的多视角缺失数据补全模型;将视角块信息矩阵、标签矩阵和缺失掩码矩阵进行拼接,从拼接后的数据中随机采样,得到两个不同批次的多视角缺失数据拼接样本,再输入多视角缺失数据补全模型,通过重构掩蔽信息矩阵的方式进行训练,得到训练后的多视角缺失数据补全模型;将多视角缺失数据拼接样本输入优化后的多视角缺失数据补全模型进行补全,得到补全结果后进行反归一化,得到最终补全结果。
-
公开(公告)号:CN116775942A
公开(公告)日:2023-09-19
申请号:CN202310452669.3
申请日:2023-04-25
申请人: 浙江大学
IPC分类号: G06F16/901 , G06F18/23 , G06F18/214 , G06N3/04 , G06N3/088 , G06Q50/00 , G06F18/22
摘要: 本发明公开了一种未知社区基数下社交网络的社区发现方法。该方法首先构建编码器,使用任意无监督方法训练编码器,将输入社交网络映射到欧氏空间,获得顶点的表征向量;计算顶点对的相似度矩阵,并对相似度进行排序,取相似度较高的顶点对构成正样本,取相似度较低的顶点对作为负样本,并分别赋予伪标签,构成训练集;构建社区关系预测模型,使用二元交叉熵损失函数训练模型,预测顶点对的社区关系,同时优化超参数;根据模型预测结果构建结构图,将结构图输入刘温算法得到最终的社区发现结果。实验表明,在不提供社区基数的条件下,该方法能够较准确地探测社交网络中的社区结构。
-
公开(公告)号:CN113239022B
公开(公告)日:2023-04-07
申请号:CN202110419669.4
申请日:2021-04-19
申请人: 浙江大学
IPC分类号: G06F16/215 , G16H70/00 , G06N3/0475 , G06N3/045 , G06N3/094
摘要: 本发明公开了一种医疗诊断缺失数据的补全方法及补全装置、电子设备、介质,该方法包括:获取存在数据缺失问题的医疗诊断数据集;将所述原始数据随机划分成初始样本点数据和候选样本点数据,并利用所述初始样本点数据,构建并训练生成对抗网络初始补全模型;利用影响函数估计出样本点对生成对抗网络初始补全模型参数和对生成对抗网络初始补全模型预测结果的影响力;利用二分搜索算法采样所述候选样本点数据中最具影响力的样本点,进一步迭代优化所述生成对抗网络初始补全模型,实现医疗诊断缺失数据补全。本发明针对在医疗诊断数据中存在的数据缺失和数据规模大等问题,提出补全方法,拥有补全效果好、效率高、可扩展性强等优点。
-
公开(公告)号:CN111581189B
公开(公告)日:2022-11-08
申请号:CN202010226776.0
申请日:2020-03-27
申请人: 浙江大学
IPC分类号: G06F16/215 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种空气质量检测数据缺失的补全方法及补全装置,该方法包括:获取存在数据缺失问题的原始数据,其中,所述原始数据为存在数据缺失的空气质量检测数据集;根据所获取的原始数据,分别构建基于变分自编码器的生成器模型和构建特征判别器模型;将构建好的基于变分自编码器的生成器模型和特征判别器模型进行结合,利用原始数据对结合后的模型进行优化训练,并通过生成器模型中变分自编码器的重构矩阵对输入原始数据进行数据补全,得到完整数据。本发明针对在数据缺失中存在的数据缺失情况多样化的问题,提出了一种高效且鲁棒的数据补全方法,拥有补全效果好、效率高、鲁棒性强等优点,能够有效的补全各种缺失情况下的缺失数据。
-
公开(公告)号:CN113380337A
公开(公告)日:2021-09-10
申请号:CN202110636186.X
申请日:2021-06-08
申请人: 浙江大学
摘要: 本发明提供了一种基于深度神经网络的有机荧光小分子光学性质预测方法。本方法通过建立新的有机荧光小分子数据库,采用分子描述符和分子指纹提取分子信息,输入多层神经网络和卷积神经网络进行深度学习训练获得有机荧光小分子光学性质预测模型,将待预测有机荧光小分子及其实验溶剂的特征信息输入训练好的有机荧光小分子光学性质预测模型从而预测其光学性质。本发明方法能准确地预测有机荧光小分子的光学性质(平均相对误差小于5%),从而提高有机荧光小分子的开发效率。
-
公开(公告)号:CN106897375A
公开(公告)日:2017-06-27
申请号:CN201710039240.6
申请日:2017-01-19
申请人: 浙江大学
IPC分类号: G06F17/30
CPC分类号: G06F16/215 , G06F16/217
摘要: 本发明公开了一种面向不确定数据的概率查询质量优化方法。给定有限资源,利用一个基于联合熵的质量函数度量查询质量,本方法能够确定需要清洗的不确定对象集合,使得在指定资源限制下达到期望查询质量最优的目的。本方法可分为两大部分:查询质量计算和清洗对象优选。在计算查询质量时,采用ASI索引所有可能的查询结果对象集,有效避免了质量计算过程中遍历所有可能世界,能够快速更新查询结果集的概率,从而提高质量计算效率。在选择清洗对象时,利用候选子集和质量函数单调性两个启发式规则,提出了一种精确的以及两种近似的清洗对象优选算法,在显著提高查询质量的同时,有效地减少了清洗对象优选时间,并保证清洗代价在给定的预算范围内。
-
公开(公告)号:CN103778194B
公开(公告)日:2017-01-18
申请号:CN201410007211.8
申请日:2014-01-07
申请人: 浙江大学
摘要: 本发明公开了一种基于反向轮廓带的商品推荐方法。本发明对用户偏好数据集采用R树索引结构并利用最佳优先搜索方法来遍历索引;在遍历索引时本发明首先计算得到对推荐商品可能感兴趣的消费者;接着利用预处理文件中的结果对找到的消费者进行验证,判断其是否对推荐商品真正感兴趣;对于用预处理结果无法判断的消费者进行进一步验证以得到最终结果。本发明结合了空间数据库的现有技术和反轮廓查询算法,向商家返回对商品真正感兴趣的消费者,并且整个查询过程只访问一次R树索引结构,从而提供了最佳性能。
-
公开(公告)号:CN103778196A
公开(公告)日:2014-05-07
申请号:CN201410007605.3
申请日:2014-01-07
申请人: 浙江大学
IPC分类号: G06F17/30
CPC分类号: G06F17/30327 , G06F17/3053
摘要: 本发明公开了一种基于双色反最近邻查询的最优选址方法。利用空间数据库中双色反最近邻查询技术,将空间四分法和泰森多边形应用到本发明中,保证查询结果具有最多的反最近邻,并使得查询结果到各自反最近邻的最小距离最大。本方法先为每个客户点生成最近位置圆域;接着用四分法找到矩形区域,并使得该区域落在尽可能多的最近位置圆域交集中;然后用两个有效的剪枝规则对上一步得到的与矩形区域相关的最近位置圆域集合进行修剪;最后根据修剪后的最近位置圆域集合及其泰森多边形找出最佳位置点。本发明极大地减少了查询的搜索空间,且查询效率明显好于现有方法,提供了最佳性能。
-
公开(公告)号:CN118378049B
公开(公告)日:2024-08-27
申请号:CN202410806313.X
申请日:2024-06-21
申请人: 浙江大学
IPC分类号: G06F18/20 , G06F17/16 , G06F18/241 , G06N3/0455 , G06N3/0499 , G06N3/08
摘要: 本发明公开了一种缺失表格数据公平预测方法,该方法包括:获取缺失表格数据特征矩阵、表格数据标签矩阵和特征缺失掩码矩阵;构建融合了注意力机制正则化计算的Transformer神经网络模型;对缺失表格数据特征矩阵进行掩蔽,计算重构误差;对缺失表格数据特征矩阵中敏感属性已知的样本生成正负样本,计算对比学习误差;将所述重构误差与对比学习误差进行加权,对神经网络模型进行预训练;将缺失表格数据特征矩阵与特征缺失掩码矩阵通过线形层映射至高维;构建微调模块,利用最小化预测标签误差对预训练后的神经网络模型进行微调,得到缺失表格数据公平预测模型;将缺失表格数据特征矩阵和特征缺失掩码矩阵输入预测模型得到最终预测结果。
-
公开(公告)号:CN118378049A
公开(公告)日:2024-07-23
申请号:CN202410806313.X
申请日:2024-06-21
申请人: 浙江大学
IPC分类号: G06F18/20 , G06F17/16 , G06F18/241 , G06N3/0455 , G06N3/0499 , G06N3/08
摘要: 本发明公开了一种缺失表格数据公平预测方法,该方法包括:获取缺失表格数据特征矩阵、表格数据标签矩阵和特征缺失掩码矩阵;构建融合了注意力机制正则化计算的Transformer神经网络模型;对缺失表格数据特征矩阵进行掩蔽,计算重构误差;对缺失表格数据特征矩阵中敏感属性已知的样本生成正负样本,计算对比学习误差;将所述重构误差与对比学习误差进行加权,对神经网络模型进行预训练;将缺失表格数据特征矩阵与特征缺失掩码矩阵通过线形层映射至高维;构建微调模块,利用最小化预测标签误差对预训练后的神经网络模型进行微调,得到缺失表格数据公平预测模型;将缺失表格数据特征矩阵和特征缺失掩码矩阵输入预测模型得到最终预测结果。
-
-
-
-
-
-
-
-
-