-
公开(公告)号:CN114969018B
公开(公告)日:2022-11-08
申请号:CN202210913441.5
申请日:2022-08-01
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/901 , G06F16/906 , G06N5/02
Abstract: 本发明实施例提供一种数据监控方法及系统,其中方法包括:确定待监控的当前数据治理平台的融合数据;将所述待监控的当前数据治理平台的融合数据输入至数据监控模型中,得到所述数据监控模型输出的数据监控结果;其中,所述数据监控模型是基于对当前数据治理平台的样本融合数据进行分类分级后生成知识图谱和质量知识库后得到的。本发明有效解决了目前数据治理平台存在的数据分类分级及质量管控工作中数据难以治理的问题。
-
公开(公告)号:CN115277858A
公开(公告)日:2022-11-01
申请号:CN202211166164.2
申请日:2022-09-23
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: H04L67/60 , H04L67/561 , H04L67/563 , H04L47/50 , G06F16/13 , G06F16/172 , G06F16/182
Abstract: 本发明涉及信息处理领域,公开了一种大数据的数据处理方法和系统,所述方法包括设置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,将描述性元数据以列表形式存储在名称节点的内存中,响应于用户端对文件的访问请求,提供内部元数据服务;在所述名称节点处,设置有静态缓存队列,所述静态缓存队列,存储对应热点文件的分块访问数据,以及在数据节点设置重定向消息,将数据的访问和地址变更能够及时反馈到用户端,实现了用户对数据节点信息的访问的快捷性。
-
公开(公告)号:CN116467427A
公开(公告)日:2023-07-21
申请号:CN202310323580.7
申请日:2023-03-29
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/335 , G06F16/36 , G06F16/35 , G06F40/242 , G06F18/2433 , G06F18/23213 , G06F40/247 , G16H50/70
Abstract: 本申请提供一种数据处理方法及装置,所述方法包括:得到原始医学知识数据集对应的各类簇;对所述各类簇进行离群检测处理,如果类簇中数据点的总数小于设定阈值或类簇中不包含标签为医学教材的医学数据,则将类簇中的所有医学数据放入离群点候选集中;根据离群点候选集中数据点的标签对所述离群点候选集进行剪枝处理;对剪枝后的离群点候选集中的数据点进行离群处理。本发明实施例提供的数据处理方法及装置,通过专门适用于该应用场景的改进聚类和离群算法,对原始医学知识数据中的离群数据进行筛选处理,还通过专门适用于该应用场景数据特点的剪枝算法,既保证离群处理的计算效率,也最大限度地保留了可用的医学知识数据。
-
公开(公告)号:CN115292303A
公开(公告)日:2022-11-04
申请号:CN202211221664.1
申请日:2022-10-08
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/215 , G06K9/62
Abstract: 本发明公开了一种数据处理方法及装置,该方法包括:对数据集中的数据进行聚类,得到各类簇;对各类簇进行离群检测处理,所述离群检测处理包括:如果所述类簇中数据点的总数小于设定阈值,则将所述类簇中的所有数据点放入离群点候选集中;否则,依次计算所述类簇中各数据点到类簇中心的距离,并将所述距离大于等于半径的数据点放入离群点候选集中;对所述离群点候选集进行剪枝处理,得到剪枝后的离群点候选集;对剪枝后的离群点候选集中的数据点进行离群处理,确定数据点是否为离群点。利用本发明方案,可以有效提升大数据的数据质量。
-
公开(公告)号:CN115168367A
公开(公告)日:2022-10-11
申请号:CN202211091952.X
申请日:2022-09-07
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/22 , G06F16/2457 , G06F16/27 , G06F11/14
Abstract: 本发明涉及信息处理领域,具体公开了一种大数据的数据配置方法和系统,所述方法包括配置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,在数据节点设置为存储节点时,在其存储的主、副分片上通过确认消息的交互完成主、副分片的数据同步,同时设置日志事件信息,满足用户主、副分片数据不一致时信息的传输处理需求,在通过日志事件信息追平情形下,提高了数据处理效率。
-
公开(公告)号:CN119227120B
公开(公告)日:2025-04-04
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN119047663A
公开(公告)日:2024-11-29
申请号:CN202411545688.1
申请日:2024-11-01
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06Q10/04 , G06Q10/063 , G06N5/022 , G06N20/00
Abstract: 本发明提供了一种企业所属产业预测方法、装置、电子设备和存储介质,方法包括:确定待预测企业对应的目标实体,目标实体的类型为企业;根据目标实体,从预先生成的企业知识图谱中查找目标实体对应的相关实体,企业知识图谱包括多个不同类型的实体、各实体之间的关系和各实体的属性,相关实体与目标实体之间具有关系,且相关实体的类型为产业;根据相关实体,获取待预测企业所属产业,将分散的企业相关知识信息整合成结构化的知识图谱,并通过推理各实体之间的隐性关系,并补全企业知识图谱,使得企业知识图谱能够反映更深层次的隐藏信息,进而可以利用企业知识图谱,查找与待预测企业的目标实体对应的相关实体,对企业所属产业进行准确预测。
-
公开(公告)号:CN115277858B
公开(公告)日:2022-12-20
申请号:CN202211166164.2
申请日:2022-09-23
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: H04L67/60 , H04L67/561 , H04L67/563 , H04L47/50 , G06F16/13 , G06F16/172 , G06F16/182
Abstract: 本发明涉及信息处理领域,公开了一种大数据的数据处理方法和系统,所述方法包括设置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,将描述性元数据以列表形式存储在名称节点的内存中,响应于用户端对文件的访问请求,提供内部元数据服务;在所述名称节点处,设置有静态缓存队列,所述静态缓存队列,存储对应热点文件的分块访问数据,以及在数据节点设置重定向消息,将数据的访问和地址变更能够及时反馈到用户端,实现了用户对数据节点信息的访问的快捷性。
-
公开(公告)号:CN115168367B
公开(公告)日:2022-11-25
申请号:CN202211091952.X
申请日:2022-09-07
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/22 , G06F16/2457 , G06F16/27 , G06F11/14
Abstract: 本发明涉及信息处理领域,具体公开了一种大数据的数据配置方法和系统,所述方法包括配置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,在数据节点设置为存储节点时,在其存储的主、副分片上通过确认消息的交互完成主、副分片的数据同步,同时设置日志事件信息,满足用户主、副分片数据不一致时信息的传输处理需求,在通过日志事件信息追平情形下,提高了数据处理效率。
-
公开(公告)号:CN114969018A
公开(公告)日:2022-08-30
申请号:CN202210913441.5
申请日:2022-08-01
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/901 , G06F16/906 , G06N5/02
Abstract: 本发明实施例提供一种数据监控方法及系统,其中方法包括:确定待监控的当前数据治理平台的融合数据;将所述待监控的当前数据治理平台的融合数据输入至数据监控模型中,得到所述数据监控模型输出的数据监控结果;其中,所述数据监控模型是基于对当前数据治理平台的样本融合数据进行分类分级后生成知识图谱和质量知识库后得到的。本发明有效解决了目前数据治理平台存在的数据分类分级及质量管控工作中数据难以治理的问题。
-
-
-
-
-
-
-
-
-