-
公开(公告)号:CN115438257A
公开(公告)日:2022-12-06
申请号:CN202211010348.X
申请日:2022-08-23
申请人: 号百信息服务有限公司
IPC分类号: G06F16/9535 , G06K9/62 , G06N20/00
摘要: 本发明涉及一种目标用户群体识别的方法,该方法包括步骤:S1、采集某产品的订购数据并将已订购该产品的用户标记为标签数据,从信令汇聚平台采集固定期限内的信令数据;S2、使用Spark框架将S1得到的信令数据集进行清洗、转换得到特征数据集;S3、数据预处理,整合标签数据集和特征数据集,得到包含特征和标签的数据集,并划分为训练集和测试集;S4、使用随机森林算法建模、训练、调优,得到特征重要性排名;S5、用户分群;S6、用户分群画像,结合步骤S4和步骤S5得到的各群组的重要特征的取值范围、已订购用户占比,对群组进行描述;S7、结合业务经验,确定出符合营销条件的用户群组及其特征变量阈值;S8、运算出符合营销条件的目标用户及其所属群组。