数据关系图谱构建方法、装置、设备、存储介质

    公开(公告)号:CN116842192A

    公开(公告)日:2023-10-03

    申请号:CN202310778767.6

    申请日:2023-06-28

    Abstract: 本发明涉及一种数据关系图谱构建方法、装置、设备、存储介质,包括:获取目标结构化数据的目标信息,根据目标信息将目标结构化数据按照主题进行分类;针对任一主题的目标结构化数据,提取数值特征和长文本特征进行聚类分析,生成多个聚类族,获取多个聚类族中关于目标结构化数据的关系对,根据预设的数据关联关系层级确定关系对的数据联系紧密度,并构建数据关系图谱。本发明利用数据关联关系层级将关系对分级,构建数据关系图谱,这一构建方式关注了数据本身内容之间的关联关系和形成过程中的重要信息,可以很好的适用于对海量数据的关联关系全量分析。

    一种自动生成数据库表间关联关系的方法、系统、电子设备及程序产品

    公开(公告)号:CN115757660A

    公开(公告)日:2023-03-07

    申请号:CN202211490525.9

    申请日:2022-11-25

    Abstract: 本发明提出一种自动生成数据库表间关联关系的方法、系统、设备及程序产品,通过模型算法对数据库表进行关联关系分析,首先基于数据表字段类型识别,其次对每一表取合适时间维度,对数据进行切片抽取,然后按照字段的类别属性对抽取的数据表的字段按照相似字段进行关联连接,如果连接的成功率在一定阈值则代表两表具有关联关系,最终得到数据库表的表间关联关系E‑R图。本发明是基于数据表字段属性,对相似属性且具有关联意义的字段进行尝试连接,不必依赖于数据表是事实表还是维度表这一属性,也不依赖于数据表相关的历史SQL语句,可实现所有表所有字段的关联关系判断,防止表与表之前关联关系的遗漏。

    保留数据特性的数据脱敏方法及装置

    公开(公告)号:CN116502261A

    公开(公告)日:2023-07-28

    申请号:CN202310332456.7

    申请日:2023-03-30

    Abstract: 本发明提供了一种保留数据特性的数据脱敏方法及装置,属于数据安全领域,其中,该方法包括:获取数据源的原始明文数据;识别所述原始明文数据中的敏感数据;解析所述敏感数据的数据类型和数据长度,其中,所述数据类型用于表征所述敏感数据是否需要保留文本特性;根据所述数据类型和数据长度对所述敏感数据进行脱敏处理。通过本发明实施例,解决了相关技术中对敏感数据脱敏导致数据特性丧失的技术问题,在保证数据安全的同时,保留了敏感数据的业务价值。

Patent Agency Ranking