发明公开
- 专利标题: 数据处理方法、装置、电子设备以及存储介质
-
申请号: CN202210113044.X申请日: 2022-01-29
-
公开(公告)号: CN114444720A公开(公告)日: 2022-05-06
- 发明人: 许韩晨玺 , 严巍 , 杨德将 , 岳洪达 , 许海洋
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 主分类号: G06N20/00
- IPC分类号: G06N20/00 ; G06K9/62
摘要:
本公开提供了一种数据处理方法、装置、电子设备以及存储介质,本公开涉及计算机技术领域,尤其涉及人工智能、数据挖掘及机器学习领域。实现方案为:获取用于建模的样本数据集;将第一数量的特征维度划分为多个类别;分别从多个类别的每个类别中选择多个特征维度,以获取第二数量的特征维度;以及对样本数据集的每个样本数据进行降维处理,包括:删除第二数量的特征维度之外的特征维度;以及对于第二数量的特征维度中的特征值为正值的每一个特征维度,使用与该特征维度相对应的语义向量替换该特征维度的特征值。