冷热数据识别方法、装置、设备及存储介质

    公开(公告)号:CN117290789A

    公开(公告)日:2023-12-26

    申请号:CN202310882742.0

    申请日:2023-07-18

    摘要: 本发明公开了一种冷热数据识别方法、装置、设备及存储介质,涉及数据处理技术领域,方法包括:获取大数据集群中的数据表以及数据表信息;对数据表信息进行特征提取,得到特征数据,特征数据包括数据访问频次、数据生成时间和数据分区时间;根据特征数据对树算法模型进行训练,得到目标树模型,树算法模型基于XGBoost算法构建,训练过程中的损失函数采用加权的二元交叉熵函数,训练过程中的目标函数基于包括正则项的代价函数建立;利用目标树模型对数据表中的数据进行属性识别,得到数据识别结果。本发明解决了识别冷热数据的方法存在识别精准度较差的问题,实现了基于机器学习的冷热数据自动识别,提升了冷热数据识别的精准度和效率。

    小区覆盖场景的确定方法和装置
    5.
    发明公开

    公开(公告)号:CN116017273A

    公开(公告)日:2023-04-25

    申请号:CN202211569876.9

    申请日:2022-12-08

    IPC分类号: H04W4/02 H04W16/24

    摘要: 本申请公开了一种小区覆盖场景的确定方法和装置。其中,该方法包括:获取基站对应的第一经纬度信息,以及多个第二经纬度信息及其对应的地理场景类型标识;根据基站的扇区确定基站对应的多个小区;获取目标小区对应的第三经纬度信息,其中,目标小区为多个小区中的任意一个;基于目标小区对应的第三经纬度信息和多个第二经纬度信息,通过K最近邻分类算法确定与目标小区距离最近的K个地理场景类型标识,K为正整数;确定目标小区覆盖的地理场景为K个地理场景类型标识中所占权重最大的地理场景类型标识对应的地理场景。根据本申请实施例的小区覆盖场景的确定方法,能够提高确定小区覆盖场景的效率、准确性和时效性。

    文件泄密风险检测方法、设备、存储介质及装置

    公开(公告)号:CN117034360A

    公开(公告)日:2023-11-10

    申请号:CN202310890701.6

    申请日:2023-07-19

    摘要: 本发明属于数据处理技术领域,公开了一种文件泄密风险检测方法、设备、存储介质及装置,本发明通过根据当前数据文件对应的第一元数据信息确定存储主键key,并通过存储主键key在预设数据库中查询第二元数据信息;根据预设分布式分组位异或算法对第一元数据信息和第二元数据信息进行元数据一致性校验,根据一致性校验结果判断所述当前数据文件是否存在泄密风险,本发明在数据文件产生时生成一份元数据信息进行保存并读取当前数据文件的元数据信息,并与前面的元数据信息进行比较,确保前后的元数据一致,由此判断数据是否存在被窃取的风险。通过元数据的一致性结果,能在数据出现安全风险时及时销毁临时数据、触发预警,提升数据安全。