基于自适应特征工程的多原发癌患者预测方法及装置
摘要:
本发明公开了基于自适应特征工程的多原发癌患者预测方法及装置,方法包括:将获取到的数据源进行数据清理,包括缺失值处理、离群点处理等;在得到的特征的基础上,通过数据变换方法库进行特征变换,经过特征选择得到新特征输入至多原发癌患者预测模型进行训练;利用机器学习,在得到的训练集样本的基础上训练模型,获取评估效果,计算奖励因子;更新选中概率向量,将选中概率向量归一化;在每月获取新数据之后,进行新特征构造,训练多原发癌患者预测模型,对模型进行月度预测迭代。本发明利用自适应特种工程的方法构造特征,提高特征构造效率,降低人力成本,并结合机器学习方法,从整个模型的系统层面优化特征选择过程,提升模型的预测效果。
0/0