多维属性最优点组的快速搜索方法

    公开(公告)号:CN107633024B

    公开(公告)日:2023-05-12

    申请号:CN201710764716.2

    申请日:2017-08-30

    申请人: 清华大学

    IPC分类号: G06F16/31 G06F8/30

    摘要: 本发明公开一种多维属性最优点组的快速搜索方法,包括:设计基础MDG构建算法;使用R‑tree索引对基础MDG构建算法进行优化;基于MDG搜索所有的g‑skyline组。本发明提出了一种R‑tree的变种来加速构建多维数据的MDG,提出了P‑MDS和G‑MDS两种基于MDG的g‑skyline组搜索算法,它们能够基于不同的策略生成候选组,同时利用skyline组合性质显著提升了这两个算法的效率,通过实验证明,G‑MDS算法的效率比现有的最好的g‑skyline搜索算法往往高1‑2个数量级,本发明提出的最优点组搜索算法非常高效。

    设备监测方法、装置及设备
    2.
    发明公开

    公开(公告)号:CN114997431A

    公开(公告)日:2022-09-02

    申请号:CN202210521103.7

    申请日:2022-05-13

    IPC分类号: G06Q10/00

    摘要: 本申请实施例提供一种设备监测方法、装置及设备。该方法包括:获取待监测设备在多个时刻的多组第一设备参数,每组第一设备参数包括多种类型的设备参数;对所述多组第一设备参数进行分解处理,得到多个第一设备参数序列,一个所述第一设备参数序列中包括一种类型的设备参数;对所述多个第一设备参数序列进行谱残差处理,以得到所述多个第一设备参数序列对应的目标谱信息;根据所述目标谱信息确定异常数据,并根据所述异常数据,确定所述待监测设备对应的监测结果。提高了设备监测的准确性。

    检测域名生成算法生成的域名的方法及装置

    公开(公告)号:CN113572770A

    公开(公告)日:2021-10-29

    申请号:CN202110841774.7

    申请日:2021-07-26

    申请人: 清华大学

    摘要: 本申请公开了一种检测域名生成算法生成的域名的方法及装置,其中,方法包括:利用独热编码及两层全连接层,从顶级域名提取顶级域名特征;利用长短期记忆网络,从次级域名提取次级域名特征;将所述顶级域名特征与所述次级域名特征进行拼接,得到域名融合特征;根据所述域名融合特征对DGA域名进行检测和分类,并根据分类结果基于对应类别的异常检测模型得到域名生成算法家族的检测结果。本申请实施例的方法不仅可以实时检测已知家族的域名生成算法域名,还可以检测未知家族的域名生成算法域名,从而可以及时发现域名生成算法新家族潜在的网络攻击。

    文本质量评估的方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118569243A

    公开(公告)日:2024-08-30

    申请号:CN202410542481.2

    申请日:2024-04-30

    摘要: 本申请涉及数据处理技术领域,具体提供了一种文本质量评估的方法、装置、设备、存储介质及程序产品。一种文本质量评估的方法,包括获取待评估的危害辨识文本;根据危害辨识文本记载的隐患要素,逻辑关联词和隐患后果,获得危害辨识文本的完整性评分、逻辑关系评分以及准确性评分;其中,完整性评分表示危害辨识文本中的隐患要素的要素类别是否完整,逻辑关系评分表示危害辨识文本的逻辑关系是否正确,准确性评分表示危害辨识文本的隐患后果是否准确;根据完整性评分、逻辑关系评分以及准确性评分,获得危害辨识文本的质量评估结果。这样,可以结合多个维度,评估危害辨识文本的文本质量,获得较为准确的质量评估结果。

    基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法

    公开(公告)号:CN108053035A

    公开(公告)日:2018-05-18

    申请号:CN201810004964.1

    申请日:2018-01-03

    申请人: 清华大学

    IPC分类号: G06N99/00 G06Q50/00

    CPC分类号: G06N20/00 G06Q50/01

    摘要: 本发明公开一种基于近似类内与类间约束的完全非平衡标签下的网络表示学习方法,包括:获取社交网络数据,网络中存在已标注的节点和未知类别的节点;对网络结构信息进行建模;对网络类内相似性进行建模;对网络类间差异性进行建模;构造网络表示学习的目标函数;根据优化问题求解算法求得目标函数的解,得到学习到的特征结果。本发明通过允许相同标签的节点处于特征空间中的同一个流形上来放宽类内相似性,通过移除不同标签节点之间的已有近邻关系来放宽类间差异性,该方法在一定合理范围内保证这两种要求,同时避免得到偏倚的结果,该方法适用于完全非平衡标注数据、平衡标注数据的半监督网络表示学习,适用于标注信息质量无法保证的场景。

    基于边的网络图嵌入方法
    6.
    发明公开

    公开(公告)号:CN107633263A

    公开(公告)日:2018-01-26

    申请号:CN201710763470.7

    申请日:2017-08-30

    申请人: 清华大学

    IPC分类号: G06K9/62

    摘要: 本发明公开一种基于边的网络图嵌入方法,包括:构建Edge2vec算法模型;使用随机梯度下降法训练Edge2vec算法模型;使用Edge2vec算法模型实现网络图嵌入。本发明提供的方法通过基于深度自动编码器的神经网络模型将网络图中的边直接映射到低维向量空间中,该方法可以保留边与边的局部近邻度信息和全局近邻度信息,与现有技术相比,本发明的方法能更有效地保留网络图中边的结构信息,在关于边的网络图分析任务中能达到更好的性能,本发明可以应用到所有关于边的网络图分析任务中。

    基于因果推断的社交网络信息传播历史排序方法

    公开(公告)号:CN106228452A

    公开(公告)日:2016-12-14

    申请号:CN201610552249.2

    申请日:2016-07-13

    申请人: 清华大学

    IPC分类号: G06Q50/00

    CPC分类号: G06Q50/01

    摘要: 本发明公开了一种基于因果推断的社交网络信息传播历史排序方法,所述方法包括:收集社交网络中信息传播的历史记录,对信息传播历史数据中的节点或边按照其在信息传播中的贡献度进行排序。本发明提供的基于因果推断的社交网络信息传播历史排序方法,首次创造性的提出了基于因果推断的社交网络中信息传播历史排序问题,通过使用责任和能力这两个指标获取因果效应的必要部分和充分部分,避免了复杂的算法,使对传播历史记录中的边或节点按照对信息传播中的贡献进行排序,计算社交网络信息传播中的每个参与者的贡献的算法更加简单,提高了用户对每个参与者贡献的直观理解。

    基于双重预防机制的事故预防服务数据化构建方法及系统

    公开(公告)号:CN116050836A

    公开(公告)日:2023-05-02

    申请号:CN202310009415.4

    申请日:2023-01-03

    摘要: 本发明提供一种基于双重预防机制的事故预防服务数据化构建方法及系统,通过网络爬取数据建立行业与领域双重预防服务相关的知识库,维护风险矩阵模板中风险评价等级和风险管控级别映射关系,导入行业与领域风险管控隐患排查清单,形成企业风险管理基础知识库,制定风险分级管控计划,分配和实施风险分级管控任务,制定隐患排查治理计划,对计划中隐患点进行排查,对治理后的隐患状态进行验收,形成戴明闭环,依照地理位置、风险等级和管控级别等多维度展示安全风险及其隐患信息分布情况,通过数据网关等方式交换共享双重预防服务相关的风险评估报告。本发明解决了现有生产安全预防服务协同技术门槛高、监管难度大、风险知识库数据化建设困难问题。

    基于用户长短期行为表征的内部威胁检测方法及装置

    公开(公告)号:CN113553579A

    公开(公告)日:2021-10-26

    申请号:CN202110777639.0

    申请日:2021-07-09

    申请人: 清华大学

    IPC分类号: G06F21/55 G06F21/56

    摘要: 本申请公开了一种基于用户长短期行为表征的内部威胁检测方法及装置,其中,方法包括:采集多种异构的用户活动日志数据,抽取原始日志数据,并将异构用户活动日志数据转化为预设格式的数据;构建活动表征,并且按时间顺序生成用户活动表征序列,通过对活动序列建模为每个时刻生成该时刻的短期行为表征;获取用户短期行为表征和用户长期行为表征,并基于用户短期行为表征和用户长期行为表征对用户长期行为模式建模,以利用建模得到的模型对内部危险进行异常预测。本申请实施例可以统一描述的日志数据格式与行为表征方法,并应用了对比学习思想设计学习任务来指导模型对用户的长期行为和短期行为模式进行建模,来解决当前内部威胁检测领域所面临的问题。

    多维属性最优点组的快速搜索方法

    公开(公告)号:CN107633024A

    公开(公告)日:2018-01-26

    申请号:CN201710764716.2

    申请日:2017-08-30

    申请人: 清华大学

    IPC分类号: G06F17/30 G06F8/30

    摘要: 本发明公开一种多维属性最优点组的快速搜索方法,包括:设计基础MDG构建算法;使用R-tree索引对基础MDG构建算法进行优化;基于MDG搜索所有的g-skyline组。本发明提出了一种R-tree的变种来加速构建多维数据的MDG,提出了P-MDS和G-MDS两种基于MDG的g-skyline组搜索算法,它们能够基于不同的策略生成候选组,同时利用skyline组合性质显著提升了这两个算法的效率,通过实验证明,G-MDS算法的效率比现有的最好的g-skyline搜索算法往往高1-2个数量级,本发明提出的最优点组搜索算法非常高效。