一种负面舆情指数的计算方法及系统

    公开(公告)号:CN104951548A

    公开(公告)日:2015-09-30

    申请号:CN201510355005.0

    申请日:2015-06-24

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种负面舆情指数的计算方法及系统,包括步骤S1,对待分类文本进行基于情感词典的正负面分类和基于Mode l模型的SVM分类,分别得到分类结果1和分类结果2;步骤S2,若所述分类结果1与所述分类结果2的值都为负面,则认为待分类文本为负面,继续执行步骤S3;若所述分类结果1与所述分类结果2的值不都为负面,则认为待分类文本为非负面,计算结束;步骤S3,将待分类文本分别与用户标注负面词典和训练集关键词典匹配,分别得到负面指标1和负面指标2;步骤S4,将所述分类结果1、所述负面指标1和所述负面指标2进行线性组合,得到待分类文本的负面舆情指数。本发明计算出的负面舆情指数准确率高,计算语料范围广且能够实时计算。

    一种结构化对等网络构建索引的方法、检索方法、装置及系统

    公开(公告)号:CN105989078A

    公开(公告)日:2016-10-05

    申请号:CN201510072216.3

    申请日:2015-02-11

    IPC分类号: G06F17/30

    摘要: 一种结构化对等网络构建索引的方法、检索方法、装置及系统。构建索引的方法包括:选取哈希函数索引参数;根据哈希函数族,将索引数据映射到l个哈希表中,每个索引数据进行k次哈希运算进入一个k维向量桶中;对于l个哈希表中的每个桶,计算随机点p的l2范数;根据随机点p的l2范数估计索引数据集合D的正态分布;根据所述正态分布,将桶空间分成常规区域和稀疏区域;根据常规区域和稀疏区域,将l个哈希表中的每个桶分别映射到一维分布式哈希表的各个键值中;根据chord路由协议,依次将各个键值插入到对等网络的各个节点中。本发明实现了将局部敏感哈希算法扩展到分布式结构化对等网络,提升了检索速度,同时保留了原有集中式局部哈希算法检索的精度。

    一种基于距离博弈的社交网络关系预测方法及系统

    公开(公告)号:CN106815653B

    公开(公告)日:2021-01-12

    申请号:CN201611182815.1

    申请日:2016-12-19

    IPC分类号: G06Q10/04 G06Q50/00

    摘要: 本发明涉及一种基于距离博弈的社交网络关系预测方法及系统,属于社交网络关系预测领域,能提高关系预测的速度和准确度。本发明先提取社交网络中所有节点和任意两个节点间的有向链接;选择其中一个节点作为目标节点,根据有向链接和有效交互模式得到该目标节点的局部结构、关系预测相关节点集合和交互子图;将关系预测相关节点集合中未与该目标节点直接连接的任一节点作为备选节点,根据交互子图得到到每个备选节点的社交距离向量;根据社交距离向量得到相对于每个备选节点的收益,据此得到该目标节点的关系预测结果,最终得到社交网络中每个节点的关系预测结果。用于高效准确进行社交网络关系预测。

    一种基于节点相似度的链路预测方法及装置

    公开(公告)号:CN106817251B

    公开(公告)日:2020-05-19

    申请号:CN201611207950.7

    申请日:2016-12-23

    IPC分类号: H04L12/24 H04L12/751

    摘要: 本发明涉及一种基于节点相似度的链路预测方法,包括以下步骤:对待分析的网络进行节点和链路表示;获取网络中两个没有直接链路连接的节点;读取所述两个没有直接链路连接的节点各自的邻居节点集合;对所述两个没有直接链路连接的节点各自的邻居节点集合取交集,得到共同邻居集合;将共同邻居集合视为子网,进行子网全局簇系数和子网中任意一个共同邻居节点簇系数的计算;根据子网全局簇系数和子网中任意一个共同邻居节点簇系数计算所述两个没有直接链路连接的节点相似度;根据计算得到的节点相似度进行链路预测。本发明在分析复杂网络局部结构中节点的相互关系时从簇系数角度出发,定义了基于局部簇系数的节点相似度计算新指标。

    一种基于距离博弈的社交网络关系预测方法及系统

    公开(公告)号:CN106815653A

    公开(公告)日:2017-06-09

    申请号:CN201611182815.1

    申请日:2016-12-19

    IPC分类号: G06Q10/04 G06Q50/00

    摘要: 本发明涉及一种基于距离博弈的社交网络关系预测方法及系统,属于社交网络关系预测领域,能提高关系预测的速度和准确度。本发明先提取社交网络中所有节点和任意两个节点间的有向链接;选择其中一个节点作为目标节点,根据有向链接和有效交互模式得到该目标节点的局部结构、关系预测相关节点集合和交互子图;将关系预测相关节点集合中未与该目标节点直接连接的任一节点作为备选节点,根据交互子图得到到每个备选节点的社交距离向量;根据社交距离向量得到相对于每个备选节点的收益,据此得到该目标节点的关系预测结果,最终得到社交网络中每个节点的关系预测结果。用于高效准确进行社交网络关系预测。

    一种结构化对等网络构建索引的方法、检索方法、装置及系统

    公开(公告)号:CN105989078B

    公开(公告)日:2019-05-07

    申请号:CN201510072216.3

    申请日:2015-02-11

    IPC分类号: G06F16/22 G06F16/28

    摘要: 一种结构化对等网络构建索引的方法、检索方法、装置及系统。构建索引的方法包括:选取哈希函数索引参数;根据哈希函数族,将索引数据映射到l个哈希表中,每个索引数据进行k次哈希运算进入一个k维向量桶中;对于l个哈希表中的每个桶,计算随机点p的l2范数;根据随机点p的l2范数估计索引数据集合D的正态分布;根据所述正态分布,将桶空间分成常规区域和稀疏区域;根据常规区域和稀疏区域,将l个哈希表中的每个桶分别映射到一维分布式哈希表的各个键值中;根据chord路由协议,依次将各个键值插入到对等网络的各个节点中。本发明实现了将局部敏感哈希算法扩展到分布式结构化对等网络,提升了检索速度,同时保留了原有集中式局部哈希算法检索的精度。

    一种负面舆情指数的计算方法及系统

    公开(公告)号:CN104951548B

    公开(公告)日:2018-04-20

    申请号:CN201510355005.0

    申请日:2015-06-24

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种负面舆情指数的计算方法及系统,包括步骤S1,对待分类文本进行基于情感词典的正负面分类和基于Mode l模型的SVM分类,分别得到分类结果1和分类结果2;步骤S2,若所述分类结果1与所述分类结果2的值都为负面,则认为待分类文本为负面,继续执行步骤S3;若所述分类结果1与所述分类结果2的值不都为负面,则认为待分类文本为非负面,计算结束;步骤S3,将待分类文本分别与用户标注负面词典和训练集关键词典匹配,分别得到负面指标1和负面指标2;步骤S4,将所述分类结果1、所述负面指标1和所述负面指标2进行线性组合,得到待分类文本的负面舆情指数。本发明计算出的负面舆情指数准确率高,计算语料范围广且能够实时计算。

    一种基于节点相似度的链路预测方法及装置

    公开(公告)号:CN106817251A

    公开(公告)日:2017-06-09

    申请号:CN201611207950.7

    申请日:2016-12-23

    IPC分类号: H04L12/24 H04L12/751

    摘要: 本发明涉及一种基于节点相似度的链路预测方法,包括以下步骤:对待分析的网络进行节点和链路表示;获取网络中两个没有直接链路连接的节点;读取所述两个没有直接链路连接的节点各自的邻居节点集合;对所述两个没有直接链路连接的节点各自的邻居节点集合取交集,得到共同邻居集合;将共同邻居集合视为子网,进行子网全局簇系数和子网中任意一个共同邻居节点簇系数的计算;根据子网全局簇系数和子网中任意一个共同邻居节点簇系数计算所述两个没有直接链路连接的节点相似度;根据计算得到的节点相似度进行链路预测。本发明在分析复杂网络局部结构中节点的相互关系时从簇系数角度出发,定义了基于局部簇系数的节点相似度计算新指标。

    一种识别网页类型的系统和方法

    公开(公告)号:CN103544210B

    公开(公告)日:2017-01-18

    申请号:CN201310391961.5

    申请日:2013-09-02

    IPC分类号: G06F17/30

    摘要: 本发明涉及网络信息检索与挖掘领域,特别涉及一种识别网页类型的系统和方法。包括以下步骤:预先定义启发式规则并生成启发式规则列表;从训练网页中提取预定特征并形成标准化的特征向量,对所述标准化的特征向量进行两次优化形成精简的特征集合,构建分类器和特征抽取器,并通过分类器生成分类模型;基于待识别网页的URL和源代码,在所述启发式规则列表中执行规则匹配;匹配成功则输出待识别网页的网页类型;不成功则利用分类器对待识别网页执行网页类型分类。本发明的识别网页类型的系统和方法,使用灵活方便,识别速度快、识别精度高,而且在对跨语种的网页进行识别时不需做大的改动,识别效率高,具有较高的实际利用价值。

    一种识别网页类型的系统和方法

    公开(公告)号:CN103544210A

    公开(公告)日:2014-01-29

    申请号:CN201310391961.5

    申请日:2013-09-02

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30876

    摘要: 本发明涉及网络信息检索与挖掘领域,特别涉及一种识别网页类型的系统和方法。包括以下步骤:预先定义启发式规则并生成启发式规则列表;从训练网页中提取预定特征并形成标准化的特征向量,对所述标准化的特征向量进行两次优化形成精简的特征集合,构建分类器和特征抽取器,并通过分类器生成分类模型;基于待识别网页的URL和源代码,在所述启发式规则列表中执行规则匹配;匹配成功则输出待识别网页的网页类型;不成功则利用分类器对待识别网页执行网页类型分类。本发明的识别网页类型的系统和方法,使用灵活方便,识别速度快、识别精度高,而且在对跨语种的网页进行识别时不需做大的改动,识别效率高,具有较高的实际利用价值。