-
公开(公告)号:CN110765739B
公开(公告)日:2023-10-10
申请号:CN201911017195.X
申请日:2019-10-24
申请人: 中国人民大学
IPC分类号: G06F40/137 , G06F40/131 , G06F40/18 , G06F40/177 , G06V30/412
摘要: 本发明涉及一种从PDF文档中自动抽取表格数据和篇章结构的方法,其步骤:从PDF文件中进行章节抽取,得到带有篇章结构的PDF文件;从带有篇章结构的PDF文件进行裁剪;对裁剪后的PDF文件进行表格抽取,同时,对章节号和章节名也进行表格抽取,得到表格;将表格以html页面进行展示,完成抽取。本发明能自动化提取数据,提供一套浏览器端的操作界面,有良好的用户交互;可以在数据处理领域中应用。
-
公开(公告)号:CN110765739A
公开(公告)日:2020-02-07
申请号:CN201911017195.X
申请日:2019-10-24
申请人: 中国人民大学
IPC分类号: G06F40/137 , G06F40/131 , G06F40/18 , G06F40/177 , G06K9/00
摘要: 本发明涉及一种从PDF文档中自动抽取表格数据和篇章结构的方法,其步骤:从PDF文件中进行章节抽取,得到带有篇章结构的PDF文件;从带有篇章结构的PDF文件进行裁剪;对裁剪后的PDF文件进行表格抽取,同时,对章节号和章节名也进行表格抽取,得到表格;将表格以html页面进行展示,完成抽取。本发明能自动化提取数据,提供一套浏览器端的操作界面,有良好的用户交互;可以在数据处理领域中应用。
-
公开(公告)号:CN110209923B
公开(公告)日:2023-07-25
申请号:CN201810601709.5
申请日:2018-06-12
申请人: 中国人民大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/9535 , G06Q50/00
摘要: 本发明提出一种话题影响力用户的推送方法和装置,其中,方法包括:获取话题影响力的订阅查询请求,所述订阅查询请求包括至少一个话题;根据社交网络中社交行为事件流,计算社交网络中各个用户对应所述话题的影响力;根据所述影响力确定与每个话题对应的符合预设影响力推送条件的实时用户集合;将所述实时用户集合推送给所述查询用户。由此,结合动态变化的社交网络中社交行为事件流确定每个话题对应的影响力较大的实时用户集合,保证了确定的实时用户集合中用户的话题影响力较高,为有关商家的营销决策提供可靠支持。
-
公开(公告)号:CN110209923A
公开(公告)日:2019-09-06
申请号:CN201810601709.5
申请日:2018-06-12
申请人: 中国人民大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/9535 , G06Q50/00
摘要: 本发明提出一种话题影响力用户的推送方法和装置,其中,方法包括:获取话题影响力的订阅查询请求,所述订阅查询请求包括至少一个话题;根据社交网络中社交行为事件流,计算社交网络中各个用户对应所述话题的影响力;根据所述影响力确定与每个话题对应的符合预设影响力推送条件的实时用户集合;将所述实时用户集合推送给所述查询用户。由此,结合动态变化的社交网络中社交行为事件流确定每个话题对应的影响力较大的实时用户集合,保证了确定的实时用户集合中用户的话题影响力较高,为有关商家的营销决策提供可靠支持。
-
-
-