-
公开(公告)号:CN108874940A
公开(公告)日:2018-11-23
申请号:CN201810558816.4
申请日:2018-06-01
申请人: 杭州电子科技大学
摘要: 本发明涉及一种基于Twitter数据的社交网络组织成员识别方法,其特征在于,包括以下步骤:爬取关注目标组织公共账号的用户,构成候选集合;寻找确定属于目标组织的用户构成种子集合;设定得分阈值和期望值;爬取候选集合中的每个用户的关注列表与被关注列表、所有推文并提取其中的推送关系;对于候选集合中的每一个用户,根据种子集合,计算识别因子,使用评估模型计算每个用户的得分;根据给定的得分阈值从候选集中筛选出得分大于得分阈值的用户构成结果集合;从候选集合中移除本轮产生的结果集合,并将新产生的结果集合加入种子集合中;迭代执行直到种子集合中成员的数量达到期望值。本发明涉及的方法能够挖掘目标组织中的成员,挖掘准确率高。
-
公开(公告)号:CN109033133A
公开(公告)日:2018-12-18
申请号:CN201810571968.8
申请日:2018-06-01
申请人: 杭州电子科技大学
IPC分类号: G06F17/30
摘要: 本发明公开了一种基于特征项权重增长趋势的事件检测与跟踪方法,其特征在于:先按新闻时序依次从新闻库中取新闻;然后从新闻中提取关键词作为特征项构建新闻向量模型;接着将第一则新闻文本作为一个事件存入事件库;再把新获取的新闻依次与事件库中的每一事件进行对比,获取最大的相似度值并与相似度阈值进行比较,若最大相似度值大于相似度阈值,则将该新闻归入到对应事件,否则,作为一个新事件存入事件库。本发明通过对事件的特征项权重依据时间的分布特征研究,发现与事件主旨关系比较密切的特征项,使用特征项的增长趋势来反映特征项的热度,根据特征项的这个特征,设计新的相似度算法,进而比较有效地检测出一些热点事件并追踪其发展态势。
-
公开(公告)号:CN108874940B
公开(公告)日:2022-05-10
申请号:CN201810558816.4
申请日:2018-06-01
申请人: 杭州电子科技大学
IPC分类号: G06F16/953 , G06F16/9535 , G06Q50/00
摘要: 本发明涉及一种基于Twitter数据的社交网络组织成员识别方法,其特征在于,包括以下步骤:爬取关注目标组织公共账号的用户,构成候选集合;寻找确定属于目标组织的用户构成种子集合;设定得分阈值和期望值;爬取候选集合中的每个用户的关注列表与被关注列表、所有推文并提取其中的推送关系;对于候选集合中的每一个用户,根据种子集合,计算识别因子,使用评估模型计算每个用户的得分;根据给定的得分阈值从候选集中筛选出得分大于得分阈值的用户构成结果集合;从候选集合中移除本轮产生的结果集合,并将新产生的结果集合加入种子集合中;迭代执行直到种子集合中成员的数量达到期望值。本发明涉及的方法能够挖掘目标组织中的成员,挖掘准确率高。
-
公开(公告)号:CN108921197A
公开(公告)日:2018-11-30
申请号:CN201810558775.9
申请日:2018-06-01
申请人: 杭州电子科技大学
CPC分类号: G06K9/6268
摘要: 本发明涉及一种基于特征选择和集成算法的分类方法,其特征在于,包括以下步骤:(1)对于已有的数据集S,采用信息增益率和对称不确定性对数据集S的每个特征计算得分,设置阈值并对特征进行筛选,删除得分小于阈值的特征,形成新的数据集S’;(2)用多个学习器对选择特征后的数据集S’进行学习,调整学习器参数,采用调参后的学习器对未知数据u进行训练,计算未知数据u属于各个类别的概率集合,使用平均法和加权投票法对概率集进行集成计算,从而得到未知数据u应分类的类别。本发明从一定程度上降低了单个分类器造成的误差,提高了分类结果的准确率、召回率以及F1值。
-
-
-