一种通用的条款与文档匹配方法

    公开(公告)号:CN111209375A

    公开(公告)日:2020-05-29

    申请号:CN202010031467.8

    申请日:2020-01-13

    IPC分类号: G06F16/33 G06F16/332

    摘要: 本发明公开了一种通用的条款与文档匹配方法,其步骤包括:1)根据条款切割体系对所选每一条款句子进行分词块操作,并对相应词块添加解释词和扩展词,生成针对每一条款的多个查询语句;2)根据条款i的每一查询语句查询收集该条款i的相关文档数据并标注所收集每一文档所对应的条款,获得每一条款i对应的标注数据集;3)对于每一条款i,根据条款i的标注数据集I训练得到该条款i的条款主题模型和条款分类模型;4)对于一待匹配条款的文档材料a,计算该文档材料a与每一条款的条款主题模型相似度和类别分类;5)根据返回的类别概率值和相似度计算各条款的匹配概率值,返回匹配概率最高的条款。本发明解决了条款与文档难以匹配的问题。

    网络水军的检测方法及装置

    公开(公告)号:CN103795592B

    公开(公告)日:2017-01-25

    申请号:CN201410027720.7

    申请日:2014-01-21

    IPC分类号: H04L12/26

    摘要: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。

    一种通用的条款与文档匹配方法

    公开(公告)号:CN111209375B

    公开(公告)日:2023-01-17

    申请号:CN202010031467.8

    申请日:2020-01-13

    IPC分类号: G06F16/33 G06F16/332

    摘要: 本发明公开了一种通用的条款与文档匹配方法,其步骤包括:1)根据条款切割体系对所选每一条款句子进行分词块操作,并对相应词块添加解释词和扩展词,生成针对每一条款的多个查询语句;2)根据条款i的每一查询语句查询收集该条款i的相关文档数据并标注所收集每一文档所对应的条款,获得每一条款i对应的标注数据集;3)对于每一条款i,根据条款i的标注数据集I训练得到该条款i的条款主题模型和条款分类模型;4)对于一待匹配条款的文档材料a,计算该文档材料a与每一条款的条款主题模型相似度和类别分类;5)根据返回的类别概率值和相似度计算各条款的匹配概率值,返回匹配概率最高的条款。本发明解决了条款与文档难以匹配的问题。

    一种基于图卷积网络的图可视化方法

    公开(公告)号:CN109753589A

    公开(公告)日:2019-05-14

    申请号:CN201811432008.X

    申请日:2018-11-28

    IPC分类号: G06F16/901 G06F16/904

    摘要: 本发明公开了一种基于图卷积网络的图可视化方法,其步骤包括:1)对于目标领域的网络G=(V,E),将网络G中的节点嵌入到一个低维欧式空间中,得到网络G的低维嵌入向量;所述低维嵌入向量包含网络G中节点的特征信息和网络G的拓扑结构信息;其中,V是节点集合,E是边集合;2)将所述低维嵌入向量构造成一张K近邻图,即KNN图;3)基于概率模型将所述KNN图在二维空间中绘制出来。本发明学习到的嵌入向量同时保留了节点的结构信息和特征信息,可以对可视化结果进行粒度化调整。

    一种基于维纳过程的异常入侵检测集成学习方法及装置

    公开(公告)号:CN103716204B

    公开(公告)日:2017-02-08

    申请号:CN201310712975.2

    申请日:2013-12-20

    IPC分类号: H04L12/26 G06N3/02

    摘要: 本发明涉及一种基于维纳过程的异常入侵检测集成学习方法,包括以下步骤:选择网络流量数据集;将每个网络流量样本及其样本概率分布输入到未初始化的神经网络分类器或者经过上次训练得到的神经网络弱分类器中,判断神经网络弱分类器对每个网络流量样本是否分类错误,调整每个网络流量样本的数量及样本概率分布;反复执行步骤2,得到多个神经网络弱分类器;分别确定每个神经网络弱分类器的权重;根据每个弱分类器及每个弱分类器对应的权重,得到强分类器;将待检测网络数据流输入到强分类器中,得到入侵检测结果;重复执行步骤6,直至所有待检测网络数据流检测完毕。本发明能够解决不平衡数据集的分类问题、得到分类正确率较高的无偏分类器。

    一种基于事件的故障定位系统及方法

    公开(公告)号:CN103209094B

    公开(公告)日:2016-06-01

    申请号:CN201310076984.7

    申请日:2013-03-11

    IPC分类号: H04L12/24

    摘要: 本发明涉及一种基于事件的故障定位系统及方法,包括实时采集事件信息的事件采集模块;将采集的事件信息进行汇总并传给事件流数据库的事件接收模块;将用户制定的故障检测规则写入规则数据库,还用于对故障信息进行显示报警的交互模块;将故障检测规则自动转化生成SQL语句的规则转换模块;用于定义数据流模型,并根据SQL语句对事件进行检测分析的事件检测分析模块;本发明提出的基于集合的事件流模型,并定义了相应的集合操作,用户只需通过选择集合操作即可制定故障检测规则,且系统可将故障检测规则自动转换成相应的SQL语句,解决了用户难以掌握复杂描述语言的问题,本方法实现简单,大大简化了故障定位操作,提高了故障定位效率。

    一种基于粒子群算法的网络水军账号识别方法及系统

    公开(公告)号:CN103617235A

    公开(公告)日:2014-03-05

    申请号:CN201310611396.9

    申请日:2013-11-26

    IPC分类号: G06F17/30

    CPC分类号: G06F17/3089

    摘要: 本发明涉及一种基于粒子群算法的网络水军账号识别方法,具体包括以下步骤:步骤1:收集β个用户的用户信息,从所述每个用户信息中提取λ个相关指标,得到β个指标向量;步骤2:对λ个指标根据需要分配权重,得到权重向量;步骤3:将β个指标向量按照其中每个指标大小进行排序,得到λ个序列;步骤4:选取每个用户为粒子,应用粒子群算法,将符合条件的粒子保存到水军用户列表;步骤5:选取水军用户列表中所有可疑水军用户,将符合条件的所有邻居加入水军用户列表。本发明在实时性方面,本发明提出的基于改进粒子群算法的网络水军账号识别方法更为适宜。

    一种基于粒子群算法的网络水军账号识别方法及系统

    公开(公告)号:CN103617235B

    公开(公告)日:2017-01-25

    申请号:CN201310611396.9

    申请日:2013-11-26

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种基于粒子群算法的网络水军账号识别方法,具体包括以下步骤:步骤1:收集β个用户的用户信息,从所述每个用户信息中提取λ个相关指标,得到β个指标向量;步骤2:对λ个指标根据需要分配权重,得到权重向量;步骤3:将β个指标向量按照其中每个指标大小进行排序,得到λ个序列;步骤4:选取每个用户为粒子,应用粒子群算法,将符合条件的粒子保存到水军用户列表;步骤5:选取水军用户列表中所有可疑水军用户,将符合条件的所有邻居加入水军用户列表。本发明在实时性方面,本专利提出的基于改进粒子群算法的网络水军账号识别方法更为适宜。

    一种基于改进DBN模型的水军检测方法及系统

    公开(公告)号:CN103729678B

    公开(公告)日:2016-10-05

    申请号:CN201310681479.5

    申请日:2013-12-12

    IPC分类号: G06N3/02 G06K9/66

    摘要: 本发明涉及一种基于改进DBN模型的水军检测方法,具体包括以下步骤:步骤1:采用已分类数据集对原始DBN深度信念网络模型进行训练和检测,构成改进DBN深度信念网络模型;步骤2:将待分类数据集中的数据输入改进DBN深度信念网络模型进行分类,完成对水军用户的识别。本发明结合DBN深度信念网络和PSO粒子群算法对“苍蝇水军”进行识别,然后构造DBN模型,用已分类数据集对模型进行训练,最后用得到的模型对待分类用户数据进行分类,即实现了“苍蝇水军”的识别。该方法是对BP神经网络算法的改进,既可以保证较高的判定准确率,又具有较短的训练时间,且不易陷入局部最优解。

    一种基于维纳过程的异常入侵检测集成学习方法及装置

    公开(公告)号:CN103716204A

    公开(公告)日:2014-04-09

    申请号:CN201310712975.2

    申请日:2013-12-20

    IPC分类号: H04L12/26 G06N3/02

    摘要: 本发明涉及一种基于维纳过程的异常入侵检测集成学习方法,包括以下步骤:选择网络流量数据集;将每个网络流量样本及其样本概率分布输入到未初始化的神经网络分类器或者经过上次训练得到的神经网络弱分类器中,判断神经网络弱分类器对每个网络流量样本是否分类错误,调整每个网络流量样本的数量及样本概率分布;反复执行步骤2,得到多个神经网络弱分类器;分别确定每个神经网络弱分类器的权重;根据每个弱分类器及每个弱分类器对应的权重,得到强分类器;将待检测网络数据流输入到强分类器中,得到入侵检测结果;重复执行步骤6,直至所有待检测网络数据流检测完毕。本发明能够解决不平衡数据集的分类问题、得到分类正确率较高的无偏分类器。