-
公开(公告)号:CN114444720A
公开(公告)日:2022-05-06
申请号:CN202210113044.X
申请日:2022-01-29
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种数据处理方法、装置、电子设备以及存储介质,本公开涉及计算机技术领域,尤其涉及人工智能、数据挖掘及机器学习领域。实现方案为:获取用于建模的样本数据集;将第一数量的特征维度划分为多个类别;分别从多个类别的每个类别中选择多个特征维度,以获取第二数量的特征维度;以及对样本数据集的每个样本数据进行降维处理,包括:删除第二数量的特征维度之外的特征维度;以及对于第二数量的特征维度中的特征值为正值的每一个特征维度,使用与该特征维度相对应的语义向量替换该特征维度的特征值。
-
公开(公告)号:CN114153815A
公开(公告)日:2022-03-08
申请号:CN202111398224.9
申请日:2021-11-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/21 , G06F16/215 , G06F16/22
摘要: 本公开提供了一种数据处理方法、装置、电子设备和存储介质,涉及计算机领域,尤其涉及设备应用领域。具体实现方案为:对第一原始数据集进行分箱处理,得到多个分箱结果,其中,每个分箱结果用于表示第一原始数据集所对应的离散数据;基于多个分箱结果确定第一原始数据集中每个数据的目标指标,其中,每个数据的目标指标用于衡量对应的数据的非稳定性;基于每个数据的目标指标对第一原始数据集进行筛选,得到目标数据集。
-
公开(公告)号:CN114547448B
公开(公告)日:2023-09-01
申请号:CN202210148468.X
申请日:2022-02-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/24 , G06F18/213 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F16/9535
摘要: 本公开提供了数据处理、模型训练方法、装置、设备、存储介质及程序,应用于人工智能领域,尤其涉及大数据、深度学习、智能风控和智能营销技术。具体实现方案为:获取第一用户的属性信息和历史行为信息;根据属性信息和历史行为信息,确定第一用户对应的第一用户特征信息,第一用户特征信息包括M个特征项对应的特征信息;对M个特征项中不同特征项对应的特征信息进行组合,得到多个组合特征信息;根据第一用户特征信息和多个组合特征信息,确定第一用户的目标类别。上述过程中,通过对M个特征项中不同特征项对应的特征信息进行组合,能够产生出更多的组合特征信息,使得在分类时考虑的特征信息更加丰富,因此,能够提高用户分类结果的准确性。
-
公开(公告)号:CN114547448A
公开(公告)日:2022-05-27
申请号:CN202210148468.X
申请日:2022-02-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9535 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本公开提供了数据处理、模型训练方法、装置、设备、存储介质及程序,应用于人工智能领域,尤其涉及大数据、深度学习、智能风控和智能营销技术。具体实现方案为:获取第一用户的属性信息和历史行为信息;根据属性信息和历史行为信息,确定第一用户对应的第一用户特征信息,第一用户特征信息包括M个特征项对应的特征信息;对M个特征项中不同特征项对应的特征信息进行组合,得到多个组合特征信息;根据第一用户特征信息和多个组合特征信息,确定第一用户的目标类别。上述过程中,通过对M个特征项中不同特征项对应的特征信息进行组合,能够产生出更多的组合特征信息,使得在分类时考虑的特征信息更加丰富,因此,能够提高用户分类结果的准确性。
-
公开(公告)号:CN114881800A
公开(公告)日:2022-08-09
申请号:CN202210561209.X
申请日:2022-05-20
申请人: 北京百度网讯科技有限公司
摘要: 本公开公开了基于金融风控的概率神经网络模型获取方法及装置,涉及计算机技术领域,尤其涉及深度学习和金融风控技术领域。具体实现方案为:采用初始风控PNN模型,获取目标风控样本数据对应的高维稀疏风控特征集合;获取高维稀疏风控特征集合中的离散风控特征集合和连续风控特征集合;控制离散风控特征处理模块对离散风控特征集合中至少一个第一离散风控特征进行embedding向量编码处理,得到第一风控特征集合,对连续风控特征集合中至少一个连续风控特征进行神经网络编码处理,得到第二风控特征集合;在第一风控特征集合和第二风控特征集合对应的模型参数满足模型条件时,获取目标风控PNN模型。
-
-
-
-