基于代价敏感主动学习和生成对抗的不平衡数据分析方法

    公开(公告)号:CN118503784A

    公开(公告)日:2024-08-16

    申请号:CN202410672448.1

    申请日:2024-05-28

    Applicant: 清华大学

    Inventor: 张和明 张路遥

    Abstract: 本发明涉及数据增强技术领域,尤其是指一种基于代价敏感主动学习和生成对抗网络的不平衡数据分析方法、装置、设备及计算机存储介质。本发明所述的不平衡数据分析方法,基于代价敏感学习策略对生成对抗网络(GAN)进行训练,接着使用基于最小边缘查询和最大差异查询的主动学习策略来进行生成数据的选择,最后将选择数据与原始数据集融合成扩充数据集,利用此数据集对分类器网络进行微调,有效提高了分类器对在线数据不平衡分析的准确性。

    一种长尾分布数据故障诊断方法、装置及存储介质

    公开(公告)号:CN116954973A

    公开(公告)日:2023-10-27

    申请号:CN202310934964.2

    申请日:2023-07-27

    Applicant: 清华大学

    Inventor: 张和明 张路遥

    Abstract: 本发明涉及故障诊断技术领域,尤其是指一种长尾分布数据故障诊断方法、装置、设备及计算机存储介质。本发明所述基于可学习数据增强网络的长尾分布数据故障诊断方法,首先生成一组变换,这些变换在保持与原始样本相似的语义信息的同时,彼此之间又具有差异性;将这组变换作为监督对比表示学习的正样本,提高监督对比学习的表示能力,通过监督对比学习获得原始样本的特征向量,进而输入分类器进行故障诊断,本发明的长尾分布数据故障诊断方法较其他方法,准确度更高,性能更好。

    一种基于增强平衡生成对抗网络的不平衡数据分析方法

    公开(公告)号:CN118468037A

    公开(公告)日:2024-08-09

    申请号:CN202410664582.7

    申请日:2024-05-27

    Applicant: 清华大学

    Inventor: 张和明 张路遥

    Abstract: 本发明涉及人工智能技术领域,尤其涉及一种基于增强平衡生成对抗网络的不平衡数据分析方法、装置、电子设备及存储介质,其中,方法包括:采用了堆叠自编码器作为基础,网络初始化采用了Xavier初始化方法以处理深度神经网络中的梯度消失和梯度爆炸问题,同时选择Adam优化器来更新网络参数以确保网络在训练过程中更容易收敛。在增强平衡对抗网络训练完毕后,利用生成器产生的少数类增强数据去对不平衡数据集进行扩充,构建平衡数据集用于基于堆叠自编码器的深度神经网络的分类器训练,最终完成不平衡数据分析任务,提高训练效率和生成样本质量。

Patent Agency Ranking