-
公开(公告)号:CN116051124A
公开(公告)日:2023-05-02
申请号:CN202310031636.1
申请日:2023-01-10
申请人: 国家电网有限公司客户服务中心
IPC分类号: G06Q30/012 , G06F18/2431 , G06F18/214
摘要: 本发明涉及电力大数据挖掘技术,为基于数据挖掘的客服系统投诉风险预警方法及系统,首先统计客户服务数据,从中提取文本特征、区域特征、投诉月度数据、投诉时段数据及投诉业务数据;对所提取的数据,基于轨迹因素、时间因素、业务因素、客户诉求时长和客户情感因素进行特征构造,获得构造后的特征集;基于SMOTE算法处理特征集中样本不平衡问题,构建平衡样本,获得平衡数据集;基于IGSA算法实现随机森林RF分类模型的超参数寻优;利用RF分类模型完成预测。本发明通过构造新样本以消除原始数据中正样本过少而对预测模型的影响,在构建平衡样本基础上进行预测模型参数寻优,解决了网格搜索算法寻找RF最优参数耗时的问题,降低了电力客服的投诉率。