一种数字资源热点生成方法及装置
摘要:
本发明提供一种数字资源热点生成方法,首先,从数字资源中提取标题和正文;然后分别获取标题相似度矩阵和正文相似度矩阵;通过分别聚类获得标题候选热点集和正文候选热点集;最后,根据所述标题候选热点集和所述正文候选热点集获取候选热点集。该方案中,使用正文信息和标题信息来进行热点推荐,正文信息和标题信息采用不同的方式处理,相互作为补充和依据,使得获得的热点更加准确,避免了现有技术中对主题词表和新词发现的需求,减弱热点发现对热点个数和经验参数的依赖,实现了面向数字报刊的热点新闻自动发现。
公开/授权文献
0/0