-
公开(公告)号:CN103279529A
公开(公告)日:2013-09-04
申请号:CN201310210570.9
申请日:2013-05-30
Applicant: 北京邮电大学
IPC: G06F17/30
Abstract: 本发明提出一种非结构化数据检索方法,包括以下步骤:采集用户行为数据;定期处理用户行为数据以将预定时间段内的用户行为数据的任务属性合并到任务列表中;根据用户的搜索请求使用关键字检索而获取多个搜索结果;计算每个搜索结果的任务分、访问次数分和编辑时长分,其中任务分是每个搜索结果的任务属性与任务列表中的任务属性的相似度;基于任务分、访问次数分和编辑时长分对多个搜索结果进行数据热度计算;根据数据热度计算将多个搜索结果进行重新排序。根据本发明实施例的方法可以提升非结构化数据的检索效率及检索准确度。本发明还提出了一种非结构化数据检索系统。