一种基于最优混合估值的大坝安全监测数据补全方法
Abstract:
本发明公开了一种基于最优混合估值的大坝安全监测数据补全方法,包括,将大坝安全监测数据集划分为训练集和测试集,其中,训练集为完整子数据集,测试集为缺失子数据集;基于训练集采用XgBoost算法构建最优预测模型;采用最优预测模型对测试集中各数据所属类的概率分布进行预测,生成测试集样本概率向量;基于测试集样本概率向量进行聚类;对于连续型数据存在缺失,则用所属类中对应特征属性的均值来补全数据;对于离散型数据缺失,则将该条数据所属类的极大似然估计作为补全数据。本发明方法解决了混合数据集中各类数据缺失的问题,可对大坝安全监测数据集的特征进行有效评估,具有更强的泛化能力和更精确的补全效果。
Patent Agency Ranking
0/0