数据处理方法、装置、介质和程序产品

    公开(公告)号:CN118981719A

    公开(公告)日:2024-11-19

    申请号:CN202410979613.8

    申请日:2024-07-19

    摘要: 本申请提供了一种数据处理的方法、装置、介质和程序产品。根据本申请的方法包括:获取待处理的目标文本数据,所述目标文本数据基于用户互动数据而得到;基于目标文本数据集包含的各个文本数据之间的相似度信息进行构图处理,得到相应的图结构;通过对所述图结构中的节点进行聚类处理,将所述图结构包含的节点划分为多个社群;基于预定的异常分析规则对各个社群的互动数据进行分析,确定是否存在异常数。本申请通过对基于大量用户的互动数据得到的文本数据进行相似度分析来得到图结构,并通过对图结构进行聚类处理得到多个社群,从而在各个社群中基于预设的条件挖掘可能存在异常的数据和相应的账户,实现对黑产相关内容和账户的识别。

    交通子区的划分方法、装置、电子设备及存储介质

    公开(公告)号:CN118968768A

    公开(公告)日:2024-11-15

    申请号:CN202411419358.8

    申请日:2024-10-11

    摘要: 本公开实施例提供了一种交通子区的划分方法、装置、电子设备及存储介质,涉及智慧交通技术领域。包括:获取待划分交通区域的路径流量数据;基于所述路径流量数据确定所述待划分交通区域的多个交叉口之间分别对应的路径关联度;以密度模块度作为目标函数,对所述多个交叉口进行层次聚类,得到使得所述目标函数最大的至少一个目标交通子区。综合考虑交叉口路径中车道数不同以及是否转向对路径流量带来的影响,准确度量交叉口之间的协调效益,同时,通过以密度模块度作为目标函数进行层次聚类,可以有效避免传统的交通子区划分模型存在的容易陷入局部最优解的缺陷,提升交通子区划分的准确性。

    一种异常数据评估方法、装置、设备及其存储介质

    公开(公告)号:CN118940186A

    公开(公告)日:2024-11-12

    申请号:CN202411072968.5

    申请日:2024-08-06

    摘要: 本申请属于金融数据处理技术领域,用于异常数据评估场景中,涉及一种异常数据评估方法、装置、设备及其存储介质,包括从多数据源采集目标评估数据;进行加密和扰动处理,得到待整合数据;对所有待整合数据进行初步整合;对初步整合的评估数据进行清洗和预处理,以及根据预设的分类维度对清洗和预处理后的企业经营数据进行分类处理,获得分类数据;将分类数据输入到异常检测模型,获得输出结果;根据输出结果和预设估值算法,计算目标评估数据的异常值。通过对多数据源提供的目标评估数据加密和扰动处理,并采用异常检测模型识别异常任务数据,保证了能够在数据安全的情况下,结合多数据来源全面性的进行异常检测,更加全面化和科学化。

    RDPC重构密度峰值的密度峰值聚类方法

    公开(公告)号:CN118940069A

    公开(公告)日:2024-11-12

    申请号:CN202410946230.0

    申请日:2024-07-15

    IPC分类号: G06F18/2321 G06F18/2413

    摘要: 本发明公开了RDPC重构密度峰值的密度峰值聚类方法,本发明提供一种重构密度峰值的密度峰值聚类算法RDPC,该算法通过重构数据点的密度分布规律,统一数据集中簇的密度分布,使簇分布更好地呈现出中心区域密度高、边缘区域密度低的峰值密度分布,较好的提高了算法的聚类效果。

    一种基于指数慢特征的工况监控方法、系统及存储介质

    公开(公告)号:CN118939993A

    公开(公告)日:2024-11-12

    申请号:CN202410907594.8

    申请日:2024-07-08

    摘要: 本发明提供了一种基于指数慢特征的工况监控方法、系统及存储系统。所述基于指数慢特征的工况监控方法包括以下步骤:确定影响能耗水平的多个条件驱动变量,并对其进行聚类处理;将常减压装置的在线运行数据的监控空间划分为慢变特征空间和快变特征空间;分别建立基于所述慢变特征的第一稳态统计量,以及基于所述快变特征的第二稳态统计量,并分别确定其第一阈值和第二阈值;分别建立基于所述慢变特征的一阶导数的第一动态统计量,以及基于所述快变特征的一阶导数的第二动态统计量,并分别确定其第一控制范围和第二控制范围;根据所述第一稳态统计量、所述第二稳态统计量、所述第一动态统计量,以及所述第二动态统计量,监控当前工况的运行状态。