一种基于微博平台的事件舆情信息提取方法及系统

    公开(公告)号:CN104615627B

    公开(公告)日:2018-03-30

    申请号:CN201410490602.X

    申请日:2014-09-23

    Abstract: 本发明涉及舆情事件提取技术,本发明公开了一种基于微博平台的事件舆情信息提取方法及系统,该方法包括:获取所述事件的关键词、起始时间、截止时间,并根据所述微博平台搜索服务的链接格式,构造待采样页面的页面链接;根据所述页面链接进行微博采样,生成样本微博,根据所述样本微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;根据所述微博抓取周期,结合所述页面链接,获取与所述事件相关的微博页面。提取所述微博页面的微博信息,以完成提取所述事件的所述舆情信息。本发明获取事件舆情信息更全面而高效,能采集到实时的舆情信息。

    一种基于微博平台的事件舆情信息提取方法及系统

    公开(公告)号:CN104615627A

    公开(公告)日:2015-05-13

    申请号:CN201410490602.X

    申请日:2014-09-23

    CPC classification number: G06F17/2765

    Abstract: 本发明涉及舆情事件提取技术,本发明公开了一种基于微博平台的事件舆情信息提取方法及系统,该方法包括:获取所述事件的关键词、起始时间、截止时间,并根据所述微博平台搜索服务的链接格式,构造待采样页面的页面链接;根据所述页面链接进行微博采样,生成样本微博,根据所述样本微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;根据所述微博抓取周期,结合所述页面链接,获取与所述事件相关的微博页面。提取所述微博页面的微博信息,以完成提取所述事件的所述舆情信息。本发明获取事件舆情信息更全面而高效,能采集到实时的舆情信息。

    一种基于微博平台的事件可视化方法及系统

    公开(公告)号:CN104536956A

    公开(公告)日:2015-04-22

    申请号:CN201410354273.6

    申请日:2014-07-23

    CPC classification number: G06F17/30864 G06F17/30905

    Abstract: 本发明公开了一种基于微博平台的事件可视化方法及系统,本发明涉及信息抽取及可视化技术,该方法包括根据该事件的关键词和时间范围,通过该微博平台的事件搜索接口,检索与该事件相关的该时间范围内的微博;将该微博按照时间进行排序,生成一个微博集合;该微博集合通过聚类算法,生成多个聚类子集;对该多个聚类子集进行关键词抽取,生成多个词云,并将重复出现在该多个词云中的该关键词赋予相同的颜色、位置、旋转方式;通过将每个该聚类子集和与其相对应的该词云进行展示的方式,将该事件进行可视化展示。依托微博平台,通过事件关键词对相关的微博进行采集,可以全面的获取关于某个事件的微博信息。

    基于模板自动生成新闻的系统和方法

    公开(公告)号:CN106021389A

    公开(公告)日:2016-10-12

    申请号:CN201610312962.X

    申请日:2016-05-12

    Abstract: 基于模板自动生成新闻的系统和方法,新闻事件日志库、新闻文章模板库、规则库组成该系统的数据库,新闻事件日志库通过选定事件日志与统计数据生成器连接,统计数据生成器分别与模板选择器、自然语言生成进行交互,自然语言生成与年报生成模块进行交互,统计数据生成器与模板选择器相交互,新闻文章模板库、模板选择器与年报生成模块相连接,年报生成模块与数据库进行连接。其实现方法的具体步骤阐述如下,建立年报日志库:建立模板库:建立规则库、选择模板、建立统计数据库、自然语言生成、年报生成;与现有技术相比,在新闻写作行业减轻了双手的劳动量,同时也提高了新闻报道的效率,为新闻发展提供了里程碑性的改革。

    结合聚类和街区距离的高维向量搜索方法

    公开(公告)号:CN103514264A

    公开(公告)日:2014-01-15

    申请号:CN201310365384.2

    申请日:2013-08-21

    CPC classification number: G06F17/3002 G06F17/30029

    Abstract: 本发明是结合聚类和街区距离的高维向量搜索方法。在本发明中,提出了一种结合聚类和街区距离的索引结构CBlockB-tree,它首先采用聚类算法对高维向量集进行簇划分,然后为各簇数据构建BlockB-tree,形成CBlockB-tree。该索引结构进行检索时,通过聚类能过滤一部分与查询区域不相交的簇数据,通过高维到一维转换后的key值比较,能进一步减少最终向量相似度匹配的运算量,加快高维向量的搜索速度。同时,该索引结构能够有效支持简单高效的街区距离进行匹配搜索。

Patent Agency Ranking