-
公开(公告)号:CN110728289B
公开(公告)日:2022-06-03
申请号:CN201810778137.8
申请日:2018-07-16
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司 , 深圳市大数据研究院
IPC分类号: G06K9/62 , G06V10/764 , G06V10/771
摘要: 本发明公开了一种家庭宽带用户的挖掘方法及设备,用于提高识别潜在家庭宽带用户的准确度。该宽带用户的分类方法包括:对采集的用户行为样本数据集进行训练,获得基于超平面的初始分类模型,其中,所述用户行为样本数据集包括至少两个宽带用户在预设时间段内上网的用户行为数据,所述用户行为数据用于表征用户进行通信业务的行为特征;根据权重系数对所述初始分类模型进行修正,其中,所述权重系数用于指示分类模型对样本错误分类的权重系数;通过修正后的分类模型对待分类的用户行为数据进行分析,获得所述至少两个宽带用户的分类结果。
-
公开(公告)号:CN110728289A
公开(公告)日:2020-01-24
申请号:CN201810778137.8
申请日:2018-07-16
申请人: 中移信息技术有限公司 , 中国移动通信集团有限公司 , 深圳市大数据研究院
IPC分类号: G06K9/62
摘要: 本发明公开了一种家庭宽带用户的挖掘方法及设备,用于提高识别潜在家庭宽带用户的准确度。该宽带用户的分类方法包括:对采集的用户行为样本数据集进行训练,获得基于超平面的初始分类模型,其中,所述用户行为样本数据集包括至少两个宽带用户在预设时间段内上网的用户行为数据,所述用户行为数据用于表征用户进行通信业务的行为特征;根据权重系数对所述初始分类模型进行修正,其中,所述权重系数用于指示分类模型对样本错误分类的权重系数;通过修正后的分类模型对待分类的用户行为数据进行分析,获得所述至少两个宽带用户的分类结果。
-
公开(公告)号:CN112651416B
公开(公告)日:2024-09-17
申请号:CN201910962985.9
申请日:2019-10-11
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F18/211
摘要: 本发明公开了特征选择方法、装置、设备和介质。该方法包括:获取原始特征集的当前待寻优特征子集;将原始特征集的候选特征子集中的第一特征加入当前待寻优特征子集,得到第一特征子集;从第一特征子集中剔除第二特征,得到第二特征子集;若第二特征子集不优于当前待寻优特征子集,将第一特征子集作为下一待寻优特征子集,直至第一特征子集满足预设停止准则,将第一特征子集选定为原始特征集的最优特征子集。根据本发明实施例提供的特征选择方法、装置、设备和介质,可以提高特征选择的精确度。
-
公开(公告)号:CN116523026A
公开(公告)日:2023-08-01
申请号:CN202310507711.7
申请日:2023-05-08
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06N3/084 , G06N3/094 , G06N3/088 , G06N3/098 , G06N3/0455 , G06N3/048 , G06N3/0464
摘要: 本申请公开了一种模型训练方法、装置、设备及计算机存储介质。该方法包括:接收云端服务器发送的全局预测模型,全局预测模型用于识别攻击行为信息;获取第一边缘服务器的第一流量和第二边缘服务器的第二流量,第一流量和第二流量分别表征用户的行为信息;基于第一流量和第二流量构建第一训练样本;利用生成对抗网络生成第一训练样本对应的第二训练样本,并将第一训练样本与第二训练样本进行对抗学习,得到第三训练样本;基于第一训练样本和第三训练样本构建第四训练样本,并基于第四训练样本训练全局预测模型,得到第一预测模型。如此能够提高第一预测模型的准确度,利用第一预测模型对攻击行为进行检测,提高了检测攻击行为的精度。
-
公开(公告)号:CN115408182A
公开(公告)日:2022-11-29
申请号:CN202110587616.3
申请日:2021-05-27
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F11/07
摘要: 本发明提供一种业务系统故障定位方法及装置,该方法包括:根据业务系统在当前时段内的运行指标,判断所述业务系统是否存在故障;若所述业务系统存在故障,则根据所述业务系统的各服务在所述当前时段内的运行指标,判断各服务是否存在故障;根据各服务的判断结果,从所述业务系统的所有服务中选择目标服务;根据所述目标服务的各实例在所述当前时段内的运行指标,判断各实例是否存在故障,根据各实例的判断结果获取所述业务系统的故障定位结果。本发明实现一方面仅对存在故障的目标服务的实例进行故障检测,大大减少计算量,有效提高定位效率;另一方面,根据层级关系逐层对业务系统的故障原因进行定位,使得定位结果更加准确。
-
公开(公告)号:CN118427191A
公开(公告)日:2024-08-02
申请号:CN202410413100.0
申请日:2024-04-07
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/22 , H04L45/74 , G06F16/21 , G06F9/48 , G06F16/2453 , G06F16/215
摘要: 本发明公开了一种数据库水平拆分方法、装置、设备、存储介质及计算机程序产品,该方法通过获取客户数据,客户数据包括三户资料和客户业务数据,三户资料包括客户标识、账户标识、用户标识和电话号码,根据客户标识生成分片键值,将分片键值与数据节点映射规则表进行匹配,确定目标数据库节点,将分片键值、账户标识、用户标识和电话号码,分别与目标数据库节点进行关联,以生成客户分片,将包含客户分片的路由数据写入至Redis路由缓存中,在路由数据对应的目标数据库节点中存储客户数据。因此,本发明利用客户标识来确定分片键值,进而利用分片键值确定目标数据库节点,实现对数据库的水平拆分,以减小单表数据量,起到缩表的作用。
-
公开(公告)号:CN117609386A
公开(公告)日:2024-02-27
申请号:CN202311714837.8
申请日:2023-12-13
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/27 , G06F16/28 , G06F16/2455
摘要: 本发明公开了一种数据分片存储方法、装置、设备及存储介质,涉及数据处理领域,所述方法包括:响应于数据存储请求,获取所述数据存储请求中包含的至少一个用户的用户信息,确定各所述用户的分片键,基于所述用户信息将各所述分片键进行关联,获得各所述分片键之间的第一映射关系,基于所述第一映射关系对各所述用户相关的待存储数据进行分片存储;由于本发明基于各用户的用户信息将各用户对应分片键进行关联,基于各分片键之间的第一映射关系对各用户相关的待存储数据进行分片存储,从而确保分片存储数据统一,有效地避免了同一用户数据跨多分片存储及分片间数据不均衡的问题,大幅提升了数据读写效率和数据业务办理效率。
-
公开(公告)号:CN112651416A
公开(公告)日:2021-04-13
申请号:CN201910962985.9
申请日:2019-10-11
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06K9/62
摘要: 本发明公开了特征选择方法、装置、设备和介质。该方法包括:获取原始特征集的当前待寻优特征子集;将原始特征集的候选特征子集中的第一特征加入当前待寻优特征子集,得到第一特征子集;从第一特征子集中剔除第二特征,得到第二特征子集;若第二特征子集不优于当前待寻优特征子集,将第一特征子集作为下一待寻优特征子集,直至第一特征子集满足预设停止准则,将第一特征子集选定为原始特征集的最优特征子集。根据本发明实施例提供的特征选择方法、装置、设备和介质,可以提高特征选择的精确度。
-
公开(公告)号:CN109977977B
公开(公告)日:2021-04-02
申请号:CN201711463187.9
申请日:2017-12-28
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
摘要: 本发明实施例公开了一种识别潜在用户的方法及对应装置,用以解决现有技术识别潜在用户准确性低的问题。方法包括:选取N个已确认用户,并获得所述N个已确认用户的特征变量的值;将所述N个已确认用户作为原始样本集,并基于所述原始样本集构建随机森林分类模型;构建所述随机森林分类模型的损失函数,并使用L1范数、L2范数正则化所述损失函数;求解正则化后的损失函数的因变量为最小时所述自变量的最优解,并根据所述最优解更新所述所有基分类器的权重系数,生成新的随机森林分类模型;将待识别用户的特征变量的值输入所述新的随机森林分类模型,获得输出结果;根据所述输出结果确定所述待识别用户为潜在用户或非潜在用户。
-
公开(公告)号:CN113570392B
公开(公告)日:2024-04-09
申请号:CN202010357238.5
申请日:2020-04-29
申请人: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06Q30/0201 , G06F16/2458 , G06F16/248
摘要: 本发明实施例提供了一种用户分群方法、装置、电子设备及计算机存储介质。该用户分群方法,包括:获取用户的目标业务特征数据;依次对目标业务特征数据进行截尾处理和切片处理,得到多个区间组合特征数据;分别确定各个区间组合特征数据的信息值;基于各个区间组合特征数据的信息值和预设筛选规则信息,从多个区间组合特征数据中筛选出目标区间组合特征数据;基于目标区间组合特征数据,确定用户的分群结果。根据本发明实施例的用户分群方法、装置、电子设备及计算机存储介质,能够在进行用户分群的过程中减少计算资源的消耗。
-
-
-
-
-
-
-
-
-