- 专利标题: 一种基于余弦距离的前沿科技信息快速推送方法及系统
-
申请号: CN201711125200.X申请日: 2017-11-14
-
公开(公告)号: CN107657067B公开(公告)日: 2021-03-19
- 发明人: 马艳 , 齐达立 , 陈玉峰 , 陈素红 , 曹建梅 , 邹立达
- 申请人: 国网山东省电力公司电力科学研究院 , 国家电网公司
- 申请人地址: 山东省济南市市中区望岳路2000号;
- 专利权人: 国网山东省电力公司电力科学研究院,国家电网公司
- 当前专利权人: 国网山东省电力公司电力科学研究院,国家电网公司
- 当前专利权人地址: 山东省济南市市中区望岳路2000号;
- 代理机构: 济南诚智商标专利事务所有限公司
- 代理商 李修杰
- 主分类号: G06F16/9535
- IPC分类号: G06F16/9535 ; G06F16/9536 ; G06F16/33
摘要:
本发明公开了一种基于余弦距离的前沿科技信息快速推送方法及系统,方法包括构造余弦距离索引和推送信息两个过程,它首先爬取科技信息文章并存储到科技信息数据库中,并对爬取科技信息文章建立索引;然后通过快速对比新增文章和数据库的原有文章来查询是否有相同或者近似的文章,判断该新增文章内容是否已经被推送过,如果没有被推送过则加以选择并进行推送给用户。系统包括余弦距离索引模块、科技信息数据库和推送信息模块。本发明不仅使推送给用户的前沿科技信息避免相似性冗余,而且采用余弦距离索引可以加快文章的相似性判断,及时地将前沿信息推送给用户。
公开/授权文献
- CN107657067A 一种基于余弦距离的前沿科技信息快速推送方法及系统 公开/授权日:2018-02-02