一种即时GPU集群信息收集的方法、装置、设备及介质

    公开(公告)号:CN120029860A

    公开(公告)日:2025-05-23

    申请号:CN202510514519.X

    申请日:2025-04-23

    Abstract: 本发明公开了一种即时GPU集群信息收集的方法、装置、设备及介质,包括:裸金属服务器环境配置,为裸金属服务器安装容器环境,分布式容器管理平台,集群系统监控和警报工具包;组件代码开发,组件是由多个模块组合而成的一段可执行程序,负责集群GPU信息收集和上报,其中包含数据抓取模块和数据库写入模块;组件部署,将组件代码批量化部署到线上环境并开始数据收集的过程。本发明实现了一种数据来源多样化和轻量化部署的解决方案。即使需要在多个数据源上同时收集异构数据,也能准确解析并快速落库。批量化镜像打包和部署提高了多组件部署的效率,有效保证了收集结果的准确性和实时性,具有良好的通用性和拓展性。

    理赔事件检测方法、计算机设备和存储介质

    公开(公告)号:CN117273959A

    公开(公告)日:2023-12-22

    申请号:CN202311198226.2

    申请日:2023-09-15

    Abstract: 本申请涉及一种理赔事件检测方法、计算机设备和存储介质,在于当前时间戳的图网络中嵌入新增节点的情况下,从历史节点中筛选目标节点,并根据新增节点和目标节点,生成随机游走路径;其中,图网络基于理赔事件构建得到,目标节点包括与新增节点相关的历史节点和/或节点权重不低于阈值的历史节点,历史节点为于当前时间戳之前在图网络中嵌入的节点;将随机游走路径输入至训练好的词向量模型,输出对应于当前时间戳的节点向量表示;根据节点向量表示,确定对应于当前时间戳的新增理赔事件是否属于欺诈事件。通过本申请,可以降低计算复杂度,提升检测实时性。

    数据异常值处理方法、装置、计算机设备和可读存储介质

    公开(公告)号:CN116756494A

    公开(公告)日:2023-09-15

    申请号:CN202311057175.1

    申请日:2023-08-22

    Abstract: 本申请涉及一种数据异常值处理方法、装置、计算机设备和可读存储介质。所述方法包括:获取多个单样本数据中的目标列数据以及多个特征列数据;基于多个所述单样本数据的历史数据,确定每个所述单样本数据的异常值处理次数;根据所述目标列数据对多个所述特征列数据进行分类,得到多个特征列数据组;基于异常值处理次数为多个所述特征列数据组分配对应的数据组处理次数;基于所述数据组处理次数,对相应特征列数据组中的特征列数据进行异常数据处理。采用本方法能够实现数据的预处理,且为特征列数据组分配恰当的异常值处理次数,确保良好的数据清洗效果的同时尽可能的减少数据处理时间和资源的浪费,大幅度提高数据异常值处理的效率和精度。

    基于多源数据迁移学习的类别预测方法和装置

    公开(公告)号:CN116304891B

    公开(公告)日:2023-08-01

    申请号:CN202310590427.0

    申请日:2023-05-24

    Abstract: 本申请涉及一种基于多源数据迁移学习的类别预测方法和装置。所述方法包括:获取多个来自不同数据源的表格数据,基于表格数据确定不同的目标任务下的关键数据映射表;通过数据向量化获取表格数据中每个单元格的文本向量,根据文本向量对待训练的自监督表格模型进行预训练;基于关键数据映射表,通过自监督表格模型确定目标任务训练集;基于目标任务对自监督表格模型进行优化,得到待优化的目标表格模型,根据目标任务训练集训练待优化的目标表格模型,得到目标表格模型;通过目标表格模型确定待预测数据的类别。采用本方法能够解决业务相似的不同机构中存在的因表格结构差异导致的预处理工作繁重、业务模型无法迁移复用等难点问题。

    数据异常值处理方法、装置、计算机设备和可读存储介质

    公开(公告)号:CN116756494B

    公开(公告)日:2024-01-23

    申请号:CN202311057175.1

    申请日:2023-08-22

    Abstract: 本申请涉及一种数据异常值处理方法、装置、计算机设备和可读存储介质。所述方法包括:获取多个单样本数据中的目标列数据以及多个特征列数据;基于多个所述单样本数据的历史数据,确定每个所述单样本数据的异常值处理次数;根据所述目标列数据对多个所述特征列数据进行分类,得到多个特征列数据组;基于异常值处理次数为多个所述特征列数据组分配对应的数据组处理次数;基于所述数据组处理次数,对相应特征列数据组中的特征列数据进行异常数据处理。采用本方法能够实现数据的预处理,且为特征列数据组分配恰当的异常值处理次数,确保良好的数据清洗效果的同时尽可能的减少数据处理时间和资源的浪费,大幅度提高数据异常(56)对比文件D. G. Perez等“.Outlier DetectionApplying an Innovative User TransactionModeling with Automatic Explanation”.《2011 IEEE Electronics, Robotics andAutomotive Mechanics Conference》.2012,全文.

    金融信贷场景下的数据链式存储方法、装置和系统

    公开(公告)号:CN117056426A

    公开(公告)日:2023-11-14

    申请号:CN202311015065.9

    申请日:2023-08-11

    Abstract: 本申请涉及一种金融信贷场景下的数据链式存储方法、装置和系统。所述方法包括:基于数据属性,对获取到的信贷交易流水数据进行拆分,生成对应的数据属性链下的新增节点数据,所述数据属性包括属性名称、属性类型、属性链首节点和属性链尾节点;对各所述数据属性链下的新增节点数据进行噪声检查;在所述噪声检查通过的情况下,基于所述新增节点数据,判断所述数据属性链下的所述属性链尾节点是否需要进行更新,若是,则在所述数据属性链下新建最新节点,并将所述新增节点数据存储至所述最新节点中。采用本方法能够解决传统信贷交易时交易数量量大、数据变化稀疏导致的存储资源浪费的问题,有效减少了存储资源的占用,提高了存储数据的实用性。

    基于自动特征挖掘的可解释信贷违约率预测方法、系统

    公开(公告)号:CN115936159A

    公开(公告)日:2023-04-07

    申请号:CN202211016771.0

    申请日:2022-08-24

    Abstract: 本发明公开了一种基于自动特征挖掘的可解释信贷违约率预测方法、系统,首先从客户信用资料库中提取每笔贷款的特征数据,并进行预处理;定义自动特征挖掘的操作算子集O和一种自动特征挖掘方法,并通过该操作算子集O得到自动特征集;构建违约率预测模型,并结合全局可解释方法和局部可解释方法,得到通过全局重要性特征排序、基于当前数据库搜索的反事实样本、基于特征扰动和生成模型的虚拟反事实样本,基于此给出可解释信贷违约率预测。本发明方法使得违约预测模型训练和更新无需专家经验干预,缓解专家经验差异大的问题,节省人力,能够满足审计需求,同时针对一线客户经理给出判断依据和相似判例参考。

    基于邻域节点结构编码的图神经网络异常检测方法与装置

    公开(公告)号:CN115859143A

    公开(公告)日:2023-03-28

    申请号:CN202211424557.9

    申请日:2022-11-14

    Abstract: 本发明公开了基于邻域节点结构编码的图神经网络异常检测方法与装置,包括:将原始数据转换为图神经网络的输入数据,输入数据包括节点属性矩阵、邻接矩阵;从邻接矩阵抽取出结构特征并进行矩阵分解,得到节点角色特征与角色结构特征因子;将节点角色特征与其转置矩阵相乘,得到高阶邻接矩阵;将节点属性矩阵与邻接矩阵、节点属性矩阵与高阶邻接矩阵分别输入图神经网络,得到节点角色语义潜变量和节点角色语义潜变量;并进行动态加权,得到最终节点表示,将其输入至激活函数,训练图神经网络,直至图神经网络收敛,将激活函数的输出向量中概率最高的标签作为分类结果即异常类别,异常类别对应的节点即为检测到的异常目标。

    基于多源数据迁移学习的类别预测方法和装置

    公开(公告)号:CN116304891A

    公开(公告)日:2023-06-23

    申请号:CN202310590427.0

    申请日:2023-05-24

    Abstract: 本申请涉及一种基于多源数据迁移学习的类别预测方法和装置。所述方法包括:获取多个来自不同数据源的表格数据,基于表格数据确定不同的目标任务下的关键数据映射表;通过数据向量化获取表格数据中每个单元格的文本向量,根据文本向量对待训练的自监督表格模型进行预训练;基于关键数据映射表,通过自监督表格模型确定目标任务训练集;基于目标任务对自监督表格模型进行优化,得到待优化的目标表格模型,根据目标任务训练集训练待优化的目标表格模型,得到目标表格模型;通过目标表格模型确定待预测数据的类别。采用本方法能够解决业务相似的不同机构中存在的因表格结构差异导致的预处理工作繁重、业务模型无法迁移复用等难点问题。

    一种基于贪心算法的机器学习分类模型解释方法

    公开(公告)号:CN116050539A

    公开(公告)日:2023-05-02

    申请号:CN202211687370.8

    申请日:2022-12-27

    Abstract: 一种基于贪心算法的机器学习分类模型解释方法,该方法使用贪心算法组合特征箱体,分别以每个筛选后箱体为起点,获得特征箱体组合。将特征匹配学习的特征箱体组合,可以对目标的特征统计情况有更加全面的了解并以此对机器学习结果做出解释。本方法运用贪心策略,对特征进行了筛选与组合,为企业提供了一种更加直观的客户筛选方法,在实际应用中主要用于辅助解释黑匣模型预测结果,服务一线业务人员。

Patent Agency Ranking