-
公开(公告)号:CN103577501B
公开(公告)日:2019-03-19
申请号:CN201210284815.8
申请日:2012-08-10
申请人: 深圳市世纪光速信息技术有限公司
IPC分类号: G06F16/9535
摘要: 本发明涉及热点话题搜索系统及热点话题搜索方法,其中热点话题搜索系统包括:新闻热词挖掘模块、新闻搜索下载模块、以及热点话题产生及匹配模块;新闻热词挖掘模块,用于定期获取新闻网站的热点新闻区域的热门新闻并提取热门新闻中的热点词组;新闻搜索下载模块,用于下载热门新闻的新闻文档;热点话题产生及匹配模块,用于根据热点词组确定与热点词组对应的每个热点话题,并根据每个热点话题对应的热点词组从下载的新闻文档中检索出与每个热点话题对应的新闻文档。本发明能够给用户展现新闻热点话题发展的全过程。
-
公开(公告)号:CN102737029B
公开(公告)日:2017-01-18
申请号:CN201110084224.1
申请日:2011-04-02
申请人: 深圳市世纪光速信息技术有限公司
IPC分类号: G06F17/30
摘要: 本发明涉及一种搜索方法及系统。该搜索方法包括以下步骤:获取用户输入的查询字符;对所述查询字符进行分类处理,得到查询字符的分类类别;根据所述查询字符及所属的分类类别进行检索,得到检索结果。上述搜索方法及系统,通过对用户输入的查询字符进行分类,再根据查询字符及分类类别进行检索,得到的检索结果更加准确的满足用户搜索需求,方便用户选择需要的检索结果,给用户的操作带来便利。
-
公开(公告)号:CN103577501A
公开(公告)日:2014-02-12
申请号:CN201210284815.8
申请日:2012-08-10
申请人: 深圳市世纪光速信息技术有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30864 , G06F17/2785
摘要: 本发明涉及热点话题搜索系统及热点话题搜索方法,其中热点话题搜索系统包括:新闻热词挖掘模块、新闻搜索下载模块、以及热点话题产生及匹配模块;新闻热词挖掘模块,用于定期获取新闻网站的热点新闻区域的热门新闻并提取热门新闻中的热点词组;新闻搜索下载模块,用于下载热门新闻的新闻文档;热点话题产生及匹配模块,用于根据热点词组确定与热点词组对应的每个热点话题,并根据每个热点话题对应的热点词组从下载的新闻文档中检索出与每个热点话题对应的新闻文档。本发明能够给用户展现新闻热点话题发展的全过程。
-
公开(公告)号:CN103377473B
公开(公告)日:2017-10-24
申请号:CN201210115756.1
申请日:2012-04-19
申请人: 深圳市世纪光速信息技术有限公司
摘要: 本发明公开了一种图像排重的方法和装置,该方法,包括:获取目标图片和至少一个基准图片的特征值;根据获取的所述特征值,判断所述目标图片是否与各基准图片的特征值差异度都大于预设阈值;如果是,则确定所述目标图片不与所述基准图片重复,并保留所述目标图片;否则,确定所述目标图片与所述基准图片重复,并丢弃所述目标图片。采用本发明提供的方法,可以提高系统资源的利用效率。
-
公开(公告)号:CN103294671B
公开(公告)日:2018-04-27
申请号:CN201210040694.2
申请日:2012-02-22
申请人: 深圳市世纪光速信息技术有限公司
IPC分类号: G06F17/30
摘要: 本发明实施例提供一种文档的检测方法及系统,涉及互联网数据处理技术领域,解决了现有的近似重复文档检测方法在查准率和查全率方面都不能达到较高要求的问题。本发明实施例中,采用了多特征指纹查询与文档相似度比较相结合的方法,由于多个特征指纹能准确地反应出待测网页文档与其它网页文档相区别的特征,且根据已有数据库中特征指纹与近似重复文档的对应关系能快速查询符合条件的记录,因此可提高近似重复文档检测的准确率和效率。通过采用文档相似度检测方法,能防止因数据库不完善造成的待测网页文档确实属于近似重复文档却不能被多特征指纹查询检测出来的情况发生,从而提高了近似重复文档检测的查全率。
-
-
-
-