基于流计算引擎的实时标签处理方法和装置

    公开(公告)号:CN108614862A

    公开(公告)日:2018-10-02

    申请号:CN201810265932.7

    申请日:2018-03-28

    Abstract: 本发明涉及一种基于流计算引擎的实时标签处理方法和装置,所述方法包括:步骤1、根据标签处理任务的需求设定标签处理任务类型;步骤2、根据所设定的标签处理任务类型,配置数据源信息、标签处理信息和数据输出信息;步骤3、根据所配置的数据源信息、标签处理信息和数据输出信息,生成标签处理任务配置元数据;步骤4、根据所述标签处理任务配置元数据,创建并执行所述标签处理任务。本发明通过简单配置自动化构建数据标签处理的任务流程。在标签处理任务中,根据元数据定义及标签处理规则定义进行标签处理,实现对多源数据进行标签处理,使数据标签处理过程规范化,提高了大数据实时标签处理方法的通用性和效率。

    一种基于多文件格式自动识别的跨地域关联统计方法

    公开(公告)号:CN107168984A

    公开(公告)日:2017-09-15

    申请号:CN201710165255.7

    申请日:2017-03-20

    CPC classification number: G06F17/30194 G06F17/30424

    Abstract: 本发明涉及一种基于多文件格式自动识别的跨地域关联统计方法,属于大数据检索分析领域。该方法通过统一SQL查询入口接收SQL查询请求;然后对SQL查询请求进行解析,以识别查询的不同文件格式;然后全局节点将解析成功后的查询请求发送到对应的分节点;然后各分节点进行相应的查询操作,并将查询结果回传给全局节点;最后全局节点对各分节点回传的数据进行关联统计并输出统计结果。本发明可以应用在离线或在线数据统计场景中,能够实现多种文件格式的自动识别,突破了地域限制,能够将不同数据中心的数据进行关联统计。

    一种基于MPP引擎的跨数据中心快速查询方法和系统

    公开(公告)号:CN107066546A

    公开(公告)日:2017-08-18

    申请号:CN201710165501.9

    申请日:2017-03-20

    Abstract: 本发明涉及一种基于MPP引擎的跨数据中心快速查询方法和系统,属于大数据检索分析领域,可应用于实时系统或离线备份系统。该方法将不同MPP引擎中的数据进行统一标记并存储到元数据中;全局中心节点接收查询请求并对其进行语法解析,然后分发送到对应的数据分中心节点;各数据分中心节点通过元数据的相应MPP引擎进行查询,并将数据传输给全局中心节点;全局中心节点利用MPP引擎对数据分中心节点返回的数据进行快速查询,并输出查询结果。本发明能够实现不同数据中心数据的联合查询,兼容多种MPP引擎,充分利用不同存储模式的特点优化查询,支持多种方式导出查询结果,便于实现上层不同应用对结果数据再分析的不同要求。

    一种海量非结构化数据的数据存储方法

    公开(公告)号:CN104731864A

    公开(公告)日:2015-06-24

    申请号:CN201510088785.7

    申请日:2015-02-26

    CPC classification number: G06F17/30628 G06F17/30132

    Abstract: 本发明公开了一种海量非结构化数据的数据存储方法。本方法为:1)设定一时间间隔T,将数据存储集群划分为多个分区,用于将同一时间间隔T内的记录存储到同一分区内;同时将每一分区划分为n个散列区;2)对于每条非结构化记录,提取其产生的时间t以及一个或多个唯一表示该记录的关键信息key;3)根据每条记录的时间t,确定其要存储到的分区,然后根据该记录的关键信息key计算其在该分区中对应的散列区值;4)根据步骤3)的计算结果,将属于同一时间间隔且散列区值相同的记录写入同一文件F中并统计该文件F的记录数,如果记录数大于设定阈值K,则在当前散列区中创建另一文件进行存储。本发明存储方法能够大大提升了数据检索效率。

    一种基于下载链接的僵尸网络恶意软件检测方法

    公开(公告)号:CN119544333A

    公开(公告)日:2025-02-28

    申请号:CN202411725602.3

    申请日:2024-11-28

    Abstract: 本发明涉及数据检测技术领域,公开了一种基于下载链接的僵尸网络恶意软件检测方法,首先进行原始流量解析,捕获环境中的pcap包并提取出pcap包中每个帧的IP、端口和url信息;对环境中的pcap包的数据进行数据集整理;进行训练检测,首先进行构建邻接矩阵,然后进行参数初始化;对初始化的数据再进行矩阵运算,然后再进行多通道训练,并进行图卷积层输入,训练出识别模型;对训练出的识别模型进行模型训练调优;将训练好的模型应用在基于下载链接的数据进行僵尸网络恶意软件的检测。本发明检测方法设计灵活,能够适应不断变化的恶意软件攻击手段和模式。通过动态调整检测策略和参数,本方法能够迅速响应和适应新出现的威胁,保持高效的检测能力。

Patent Agency Ranking