一种网页数据信息的定向采集方法及装置

    公开(公告)号:CN102339290A

    公开(公告)日:2012-02-01

    申请号:CN201010236363.7

    申请日:2010-07-22

    Inventor: 吴新丽 杨建武

    Abstract: 本发明公开了一种网页数据信息的定向采集方法,用以解决现有技术中搜索引擎在进行信息采集时,造成的资源浪费及信息采集不准确的问题。该方法确定列表页当前的页面更新率,根据列表页所属网站的标准更新率,确定的所述列表页当前的页面更新率,及当前的信息采集时间间隔,确定针对所述网站当前信息采集与下一次信息采集的时间间隔,在等待该确定的时间间隔后,进行信息采集。本发明还提供了一种网页数据信息的定向采集装置。如本发明提出的方案,通过确定列表页的页面更新率,动态的确定信息采集的时间间隔,因此可以在网页刷新时准确的获取到信息,并且减少了网络资源的浪费。

    一种舆情事件检测方法及装置

    公开(公告)号:CN107193796B

    公开(公告)日:2021-12-24

    申请号:CN201610197073.3

    申请日:2016-03-31

    Abstract: 本发明公开了一种舆情事件检测方法及装置,方法包括:获取待检测文本的特征词向量;获取所有特征词对应的向量,并获取敏感义项向量;计算待检测文本的特征词向量和所有特征词对应的特征词向量的相似度;获取相似度最大时对应的第一敏感义项,并获取待检测文本中第一敏感义项的数量和待检测文本中特征词的数量,根据第一预设权值和第二预设权值,计算第一敏感义项的数量和特征词的数量的加权和,当加权和大于阈值时确定待检测文本中描述的事件为舆情事件。本发明通过对待检测文本向量化,能够达到有效的语义约束;同时通过计算待检测文本的特征词向量和所有特征词对应的特征词向量的相似度,能够准确检测出需要进行关注的舆情事件的问题。

    长微博图片识别方法和装置

    公开(公告)号:CN107203764B

    公开(公告)日:2020-08-07

    申请号:CN201610158219.3

    申请日:2016-03-18

    Abstract: 本发明提供一种长微博图片识别方法和装置,该方法包括:获取待识别微博图片;将待识别微博图像转换为灰度图片;对灰度图片进行图像形态学处理,其中,图像形态学处理包括二值化处理、腐蚀和膨胀处理;对所述图像形态学处理后的图片进行文字行识别;当识别出的文字行数大于预设行数阈值时,确定待识别微博图片为长微博图片。基于对待识别微博图片的图像处理,以及有效文字行的识别处理,能够准确而高效地识别出待识别微博图片是否为长微博图片。进而使得基于对长微博图片的识别结果而进行的数据分析更加具有针对性,信息处理冗余度更低,数据分析处理效率更高。

    一种应用解锁方法及装置

    公开(公告)号:CN106033310B

    公开(公告)日:2020-03-06

    申请号:CN201510105696.9

    申请日:2015-03-11

    Abstract: 本发明提供了一种应用解锁方法及装置,其中方法包括:在用户终端当前界面上显示应用解锁界面;获取用户在所述应用解锁界面中输入的触点信息;判断所述触点信息与预设的解锁信息是否一致,所述解锁信息在所述终端上显示的应用解锁界面在第一预设时间段内无重复;若所述触点信息与所述解锁信息相一致,所述用户终端的触摸屏解锁。通过本发明提供的应用解锁方法及装置,能够有效提高智能手机的安全性。

Patent Agency Ranking