-
公开(公告)号:CN109033133A
公开(公告)日:2018-12-18
申请号:CN201810571968.8
申请日:2018-06-01
申请人: 杭州电子科技大学
IPC分类号: G06F17/30
摘要: 本发明公开了一种基于特征项权重增长趋势的事件检测与跟踪方法,其特征在于:先按新闻时序依次从新闻库中取新闻;然后从新闻中提取关键词作为特征项构建新闻向量模型;接着将第一则新闻文本作为一个事件存入事件库;再把新获取的新闻依次与事件库中的每一事件进行对比,获取最大的相似度值并与相似度阈值进行比较,若最大相似度值大于相似度阈值,则将该新闻归入到对应事件,否则,作为一个新事件存入事件库。本发明通过对事件的特征项权重依据时间的分布特征研究,发现与事件主旨关系比较密切的特征项,使用特征项的增长趋势来反映特征项的热度,根据特征项的这个特征,设计新的相似度算法,进而比较有效地检测出一些热点事件并追踪其发展态势。