一种基于最优混合估值的大坝安全监测数据补全方法

    公开(公告)号:CN113139570A

    公开(公告)日:2021-07-20

    申请号:CN202110242719.6

    申请日:2021-03-05

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于最优混合估值的大坝安全监测数据补全方法,包括,将大坝安全监测数据集划分为训练集和测试集,其中,训练集为完整子数据集,测试集为缺失子数据集;基于训练集采用XgBoost算法构建最优预测模型;采用最优预测模型对测试集中各数据所属类的概率分布进行预测,生成测试集样本概率向量;基于测试集样本概率向量进行聚类;对于连续型数据存在缺失,则用所属类中对应特征属性的均值来补全数据;对于离散型数据缺失,则将该条数据所属类的极大似然估计作为补全数据。本发明方法解决了混合数据集中各类数据缺失的问题,可对大坝安全监测数据集的特征进行有效评估,具有更强的泛化能力和更精确的补全效果。