Invention Publication
- Patent Title: 一种基于网络媒体的热门事件提取方法
- Patent Title (English): Hot event extraction method based on network media
-
Application No.: CN201710882339.2Application Date: 2017-09-26
-
Publication No.: CN107644089APublication Date: 2018-01-30
- Inventor: 沈满 , 吴杰 , 杨曦 , 陈彬 , 段春先 , 谢倩
- Applicant: 武大吉奥信息技术有限公司
- Applicant Address: 湖北省武汉市东湖开发区庙山小区江夏大道武大科技园
- Assignee: 武大吉奥信息技术有限公司
- Current Assignee: 吉奥时空信息技术股份有限公司
- Current Assignee Address: 湖北省武汉市东湖开发区庙山小区江夏大道武大科技园
- Agency: 北京双收知识产权代理有限公司
- Agent 曾晓芒
- Main IPC: G06F17/30
- IPC: G06F17/30 ; G06F17/27

Abstract:
本发明适用于信息挖掘技术领域,提供一种基于网络媒体的热门事件提取方法,首先将新闻、评论文本发布的时间区间划分为若干个等间隔的时间片。其次,在每个时间片内提取新闻文本的关键词及权重,用优化增量聚类方法对这些新闻文本进行聚合分类,得到该时间片内的每个话题及其空间向量模型,并根据模型计算话题热度,按照热度保留有效话题。第三,对所有的时间片的话题再用优化增量聚类方法进行聚合分类,得到不同的事件,计算事件热度。最后,判断事件是否热门,并通过热度对热门的事件排序。本发明改进了普通的增量聚类算法,并建立多级的优化增量聚类模型,提高了计算速度;并且根据媒体的关注情况和网民的舆论情况计算事件的热度,并判断事件是否热门,对热门的事件排名,此方法更客观,减少了事件排名的误差。
Public/Granted literature
- CN107644089B 一种基于网络媒体的热门事件提取方法 Public/Granted day:2020-08-04
Information query