-
公开(公告)号:CN112256964A
公开(公告)日:2021-01-22
申请号:CN202011140311.X
申请日:2020-10-22
Applicant: 重庆邮电大学 , 重庆市住房公积金管理中心
IPC: G06F16/9535 , G06F16/951 , G06K9/62 , G06N3/08
Abstract: 本发明涉及一种基于多维度数据学习的金融机构潜在客户推荐方法,属于数据处理技术领域。通过数据获取模块获取初始样本数据,根据预设的数据结构将所述样本数据建立初始数据集并存储至服务器主体中;数据处理模块对数据进行清洗,去除唯一属性,进行缺失值处理和异常值处理,最后对数据标准化,保证数据集中的数据全都真实有效;数据筛选模块对所述数据集进行筛选,用PCA对数据降维,方便之后数据的可视化;推荐模型模块先获取上述经过处理之后的多维数据,然后将多维数据送入推荐模型中进行数据分析得到分析结果,并为每个客户进行等级预测。本发明在保证数据分析速度时同时兼顾精度,提高数据分析的效率。
-
公开(公告)号:CN113239199A
公开(公告)日:2021-08-10
申请号:CN202110541128.9
申请日:2021-05-18
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于多方数据集的信用分类方法,属于数据挖掘领域。本发明方法包括:输入信用评估相关的多方数据集;对多个数据集数据进行数据预处理,解决原始数据集中存在的多种问题,并得到标准输入数据集;利用机器学习中的聚类算法与数据生成算法,将多个数据集进行对齐,得到对齐后的新数据集;将文本类型特征与数值类型特征分别输入到两个模型中单独训练;最后结合两个模型中的训练结果,使用逻辑回归方法计算最终两个模型权重,并输出最终的评估结果。本发明通过引入数据对齐方法与信用评估算法解决多个信用数据集中样本数量无法对齐的问题,提高了可被用于训练的样本数量,减少了由于训练样本不足带来的机器学习模型分类无法收敛的问题。
-
公开(公告)号:CN113239199B
公开(公告)日:2022-09-23
申请号:CN202110541128.9
申请日:2021-05-18
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于多方数据集的信用分类方法,属于数据挖掘领域。本发明方法包括:输入信用评估相关的多方数据集;对多个数据集数据进行数据预处理,解决原始数据集中存在的多种问题,并得到标准输入数据集;利用机器学习中的聚类算法与数据生成算法,将多个数据集进行对齐,得到对齐后的新数据集;将文本类型特征与数值类型特征分别输入到两个模型中单独训练;最后结合两个模型中的训练结果,使用逻辑回归方法计算最终两个模型权重,并输出最终的评估结果。本发明通过引入数据对齐方法与信用评估算法解决多个信用数据集中样本数量无法对齐的问题,提高了可被用于训练的样本数量,减少了由于训练样本不足带来的机器学习模型分类无法收敛的问题。
-
-