一种网络化的Hive表数据加载方法

    公开(公告)号:CN118410094B

    公开(公告)日:2024-09-06

    申请号:CN202410866252.6

    申请日:2024-07-01

    摘要: 本发明涉及大数据Hive技术领域,尤其涉及一种网络化的Hive表数据加载方法,包括:在客户端主机中保存服务端接受客户端主机的文件的系统路径;解析出用户名和密码;使用所述服务端尝试访问子目录,捕获尝试访问中出现的异常访问的捕获次数;在所述客户端主机名与所述服务端主机名相同或加载指令未携带用户名和密码时直接从本地目录读取数据导入所述Hive表。本发明通过加密传输减少了数据泄露的风险,显著提升了数据加载的安全性,同时,通过自动化的远程加载流程和智能优化的数据移动任务,提高了操作的效率和数据加载的性能,服务端的实时监控和错误恢复机制进一步增强了数据加载的可靠性,确保了即使在出现问题时也能快速响应和解决。

    一种动态参数数据管理运行的方法、装置及存储介质

    公开(公告)号:CN118394350B

    公开(公告)日:2024-09-06

    申请号:CN202410866213.6

    申请日:2024-07-01

    IPC分类号: G06F8/41 G06F8/36 G06F11/36

    摘要: 本发明涉及数据管理领域,尤其涉及一种动态参数数据管理运行的方法、装置及存储介质,本发明通过对执行记录进行结构分析,确定结构差异特征,基于结构差异特征结合被传输时的传输特征的离散差异确定针对执行记录的显性结构离散参数,并划分显性结构离散类别,后续针对显性结构离散类别适应性的选定不同的异常分析方式,尤其针对显性结构弱离散类别执行记录识别特异记录段,遍历提取特异记录段中的代码判定是否存在异常,并且调整抽取粒度,对非特异记录段中的代码进行抽取,判定是否存在异常,进而,考虑执行记录间结构的差异,适应性选定异常分析方式,在保证可靠性的前提下,减少对大量执行记录分析时的算力消耗,保证验证效率和验证效果。

    一种数据服务模式下面向SQL的自动机器学习模型构建方法

    公开(公告)号:CN118569900A

    公开(公告)日:2024-08-30

    申请号:CN202410675751.7

    申请日:2024-05-29

    摘要: 本发明涉及机器学习技术领域,尤其涉及一种数据服务模式下面向SQL的自动机器学习模型构建方法,该方法包括对获取到的客户信息预处理以及特征挖掘以生成AI表格;根据客户信息确定AI表格中的信息种类;根据客户浏览商品时的位置类型选择相应的信息种类,并根据选择的信息种类中商品的搜索事件发生次数以及所述搜索事件发生的最大时间数值确定商品推荐等级;将为客户推荐商品过程的数据作为训练数据输入至模型中训练以得到自动机器学习模型;根据客户对商品推荐页面的商品购买率确定商品推荐过程的合格性,本发明通过对客户浏览商品时使用的网络类型选择AI表格中的信息为客户推荐商品,提高了构建自动机器学习模型过程控制的精准性。

    一种跨环境的数据同步方法及装置

    公开(公告)号:CN118568181A

    公开(公告)日:2024-08-30

    申请号:CN202411034503.0

    申请日:2024-07-31

    IPC分类号: G06F16/27 G06F16/2458

    摘要: 本发明涉及数据管理技术领域,尤其涉及一种跨环境的数据同步方法及装置,该方法包括获取若干环境的初始数据集并构建初始数据库和跨环境数据库;获取新增的实时数据集并查询其余初始数据库中是否存在相同字段的数据集;计算数据同步优先指数并确定数据同步策略和同步等级策略;将相同字段的数据集通过数据通道同步至跨环境数据库中的各初始数据库中;实时监测各个初始数据库的实时同步效率,并根据比较结果调整数据同步策略和同步等级策略。本发明有效地实现跨环境的数据同步,提高数据同步的效率和准确性。

    一种基于垂直对偶概念分解的聚类方法

    公开(公告)号:CN118520318A

    公开(公告)日:2024-08-20

    申请号:CN202410758817.9

    申请日:2024-06-13

    摘要: 本发明涉及数据分解聚类技术领域,特别是指一种基于垂直对偶概念分解的聚类方法,该方法包括:步骤S1,对目标数据集进行预处理,以得到标准数据集;步骤S2,根据明义特征对所述标准数据集进行一次聚类,以得到各初始数据簇,并对一次聚类结果进行分析,以评价一次聚类效果;步骤S3,根据暗义特征对各初始数据簇进行二次聚类,并对二次聚类结果进行分析,以确定是否对各初始数据簇进行数据增加以得到各实际数据簇;步骤S4,根据一次评价结果对一次聚类进行修正,并根据一次聚类结果和二次聚类结果对整体聚类进行修正,以保证整体聚类效果。本发明通过全面、准确地反映数据的内在结构和特征,使得聚类结果的精细度高;整体聚类效果好。

    一种数据动态脱敏方法
    6.
    发明授权

    公开(公告)号:CN118332604B

    公开(公告)日:2024-08-09

    申请号:CN202410748503.0

    申请日:2024-06-12

    发明人: 高海玲 刘叶飞

    IPC分类号: G06F21/62

    摘要: 本发明涉及数据脱敏领域,尤其涉及一种数据动态脱敏方法,本发明通过将用户端上传至在线论坛的若干评论文本划分为若干评论文本段,由各所述评论文本段中随机抽取预定比例的关键词组合,确定各关键词组合的显性语义匹配度,划分评论文本段的语义隐藏倾向,后续依据评论文本段的语义隐藏倾向适应性采用不同的脱敏策略对评论文本段进行脱敏,在面对海量数据需脱敏时,节约算力,针对于强语义倾向段的评论文本段,识别特异性关键词组合并进行隐藏重组,基于所得的转换后评论文本段的语义匹配度识别特异性关键词组合中是否存在敏感关键词,通过上述过程,考虑敏感关键词被隐藏替换的情况,提高敏感关键词被隐藏替换下的脱敏效率和准确性。

    一种SQL建表语法解析和生成的方法

    公开(公告)号:CN118331991B

    公开(公告)日:2024-08-09

    申请号:CN202410748562.8

    申请日:2024-06-12

    IPC分类号: G06F16/242 G06F16/22

    摘要: 本发明属于数据库应用领域,尤其涉及一种SQL建表语法解析和生成的方法,该方法能够应用于低代码或数据平台应用中,更具体为生成建表SQL或解析SQL中表结构内容等场景,包括:生成若干词汇单元;根据词汇单元形成若干对应关系;根据指令单元形成过滤数据;形成过滤数据的过滤索引;根据过滤索引与基础索引,并形成数据库的索引;利用数据库的索引建表。利用对数据库原数据的关键词进行解析,并将关键词进行分类以自动生成对应的数据库的索引的方式,自动化控制不同数据源的产品,并能将各数据源的产品利用过滤数据扩展至不同的数据库内,从而有效提升了数据库对数据源的兼容性。

    一种基于mybatis插件的多数据源适配方法及系统

    公开(公告)号:CN118332605B

    公开(公告)日:2024-08-02

    申请号:CN202410748531.2

    申请日:2024-06-12

    IPC分类号: G06F21/62 G06F21/60

    摘要: 本发明涉及数据处理技术领域,尤其涉及一种基于mybatis插件多数据源适配的方法,包括:确定基础数据库和迁移数据库的数据定义规则,配置对应的mybatis插件进行数据转译;设置数据库加密规则;使用mybatis插件对需要进行转译的SQL语句进行处理前,在基础数据库的业务逻辑层配置加密表达规则;使用mybatis插件对加密后的数据进行转译并将转译后的数据输出至迁移数据库;确定是否达到安全解密条件;达到安全解密条件后,在mybatis插件断开与迁移数据库的连接后,将转译后的数据解密为输出数据;本发明有效地保证了数据适配过程中的数据安全性,提高了数据适配的准确性。

    一种网络化的Hive表数据加载方法

    公开(公告)号:CN118410094A

    公开(公告)日:2024-07-30

    申请号:CN202410866252.6

    申请日:2024-07-01

    摘要: 本发明涉及大数据Hive技术领域,尤其涉及一种网络化的Hive表数据加载方法,包括:在客户端主机中保存服务端接受客户端主机的文件的系统路径;解析出用户名和密码;使用所述服务端尝试访问子目录,捕获尝试访问中出现的异常访问的捕获次数;在所述客户端主机名与所述服务端主机名相同或加载指令未携带用户名和密码时直接从本地目录读取数据导入所述Hive表。本发明通过加密传输减少了数据泄露的风险,显著提升了数据加载的安全性,同时,通过自动化的远程加载流程和智能优化的数据移动任务,提高了操作的效率和数据加载的性能,服务端的实时监控和错误恢复机制进一步增强了数据加载的可靠性,确保了即使在出现问题时也能快速响应和解决。

    一种多网络环境的访问对象存储方法

    公开(公告)号:CN118250295B

    公开(公告)日:2024-07-23

    申请号:CN202410669011.2

    申请日:2024-05-28

    摘要: 本发明涉及文件处理技术领域,尤其涉及一种多网络环境的访问对象存储方法,包括,针对多局域网中的各设备对IP的访问次数进行监控,根据单个设备针对同一IP在预设检测时长的访问次数对访问对象的运行状态是否符合预设标准进行判定;根据预设历史时长内单个设备针对单个IP的访问次数与预设历史时长的比值二次确定访问对象的运行状态是否符合预设标准;对单个设备与单个IP对应的各设备的关联度进行存储,或根据单个设备与单个IP传输的数据的数据量与传输时长的比值确定针对并行文件模块的处理方式;确定针对单个设备的处理方式;在判定用调节后的运行参数运行。提高了数据传输的稳定性,进而提高了数据传输的效率。