一种用于评估垃圾信息挖掘规则的方法与设备

    公开(公告)号:CN102982048B

    公开(公告)日:2017-08-01

    申请号:CN201110264221.6

    申请日:2011-09-07

    Abstract: 本发明的目的是提供一种用于评估垃圾信息挖掘规则的方法与设备,其中,评估设备获取待评估的挖掘规则及用于评估所述挖掘规则的信息发布样本;随后,基于所述挖掘规则对所述信息发布样本进行垃圾信息挖掘,进而获取与所述挖掘规则相对应的至少一项评价参数。与现有技术相比,本发明通过获取与待评估的挖掘规则相对应的至少一项评价参数,向互动平台管理者提供了对该挖掘规则进行评估的指标,进而可对该挖掘规则进行优化更新,以提高所述各项评价参数,使得互动平台可以更为准确判断垃圾信息并对其进行处理,从而保障互动平台的正常工作。

    用于确定行为相关质量信息的方法、装置和设备

    公开(公告)号:CN102984191B

    公开(公告)日:2017-06-09

    申请号:CN201110264336.5

    申请日:2011-09-07

    Abstract: 本发明提供一种用于确定行为相关质量信息的方法、装置和设备,本发明的方案包括:获取用户在网络社区中至少一次网络行为的行为相关信息;根据所述行为相关信息,并结合预获取的所述用户的用户质量信息,确定与所述至少一次网络行为中的一次或多次网络行为相关的行为相关质量信息。与现有技术相比,本发明具有以下优点:能够获得较高的质量判断准确度。

    一种用于识别失序文本的方法与设备

    公开(公告)号:CN102982011B

    公开(公告)日:2017-05-31

    申请号:CN201110264214.6

    申请日:2011-09-07

    Abstract: 本发明的目的是提供一种用于识别失序文本的方法与设备。其中,识别设备获取待识别的目标文本;根据所述目标文本,获得与所述目标文本相对应的统计信息;根据所述统计信息,识别所述目标文本是否为失序文本。与现有技术相比,本发明根据获得的与目标文本相对应的统计信息,识别该目标文本是否为失序文本,进而实现有效的文本内容管理。

    识别实体的方法和装置
    4.
    发明公开

    公开(公告)号:CN104102712A

    公开(公告)日:2014-10-15

    申请号:CN201410337306.6

    申请日:2014-07-15

    CPC classification number: G06F17/30861 G06F17/30964

    Abstract: 本发明提出一种识别实体的方法和装置,该方法包括接收用户输入的待识别的实体的输入信息,并根据所述输入信息获取候选结果集;在所述候选结果集不满足预设条件时,向所述用户展示输出信息,以及,接收所述用户根据所述输出信息再次输入的输入信息,并根据所述再次输入的输入信息再次获取候选结果集,直至所述候选结果集满足预设条件;将所述满足预设条件的候选结果集中的结果作为识别结果展示给所述用户。该方法可以提高实体的识别准确率,提升用户体验。

    一种用于生成网络社区中的待发布信息的方法与设备

    公开(公告)号:CN102663078B

    公开(公告)日:2014-02-26

    申请号:CN201210096043.5

    申请日:2012-04-01

    Inventor: 李彦宏 刘露

    Abstract: 本发明的目的是提供一种用于生成网络社区中的待发布信息的方法与设备。其中,本发明根据信息提供者的属性信息,如行业属性、偏好设置、历史发布信息等,确定与所述信息提供者的属性信息相适应的信息发布方式;接着,根据所述信息发布方式,并基于所述信息提供者提供的素材信息,生成待发布信息;即将信息提供者的属性信息作为生成待发布信息的条件,从而满足了信息提供者的发布需求;同时,生成的待发布信息是信息提供者提供素材信息的较佳展示形式,提高网络社区中信息的发布效果,进而提高用户浏览体验。

    文档检测方法及装置
    7.
    发明公开

    公开(公告)号:CN102915295A

    公开(公告)日:2013-02-06

    申请号:CN201210340026.1

    申请日:2011-03-31

    Abstract: 本发明提供一种文档检测方法,包括:获取与文档相应地段落特征信息;将所述文档的段落特征信息与至少一个已有文档的段落特征信息进行比对;根据所述比对结果判断是否具有与所述文档相似的已有文档。本发明通过段落特征信息对文档进行检测,可较为准确地进行文档之间的相似度比对,避免了对文档分段处理的作弊行为,且查询效率较高、服务器处理压力较小;将该文档检测方法用于改善在线文档版权属性检测,可在文档上传时,即对该文档进行检测,以避免后续对文档版权属性检测时,给服务器造成的不必要压力;同时,可批量的处理已有文档的版权属性检测,效率较高。

    一种用于在网络社区中对发布信息进行定位的方法与设备

    公开(公告)号:CN102651025A

    公开(公告)日:2012-08-29

    申请号:CN201210096056.2

    申请日:2012-04-01

    Inventor: 李彦宏 刘露

    Abstract: 本发明的目的是提供一种用于在网络社区中对发布信息进行定位的方法与设备。其中,本发明中根据网络社区中发布信息的相关信息,确定所述发布信息的重要度,接着根据所述发布信息的重要度,并基于预定的定位规则,确定所述发布信息在所述网络社区中的位置;即将发布信息的发布方式、用户对发布信息的反馈信息、发布信息的自身价值等多个判断因素相结合,以确定发布信息的重要度,从而在网络社区中对发布信息进行定位;进一步完善了发布信息的定位机制;当网络社区中在短时间内发布大量信息的情况下,重要度高而用户没有及时反馈的发布信息不会被大量发布信息所淹没,提高发布信息的发布效果。

    网络留言系统及留言过滤方法

    公开(公告)号:CN1949780B

    公开(公告)日:2012-04-18

    申请号:CN200610140847.5

    申请日:2006-10-12

    Abstract: 本发明涉及一种网络留言系统,包括用户接口、用户操作控制模块、生成验证码模块及后台管理系统;后台管理系统包括后台管理模块、数据库管理系统及提交管理模块。本发明网络留言过滤方法当获知用户浏览页面信息时分配浏览ID,根据过滤词敏感度的不同采取先发表留言后过滤或先过滤后发表留言的方法。本发明在获得浏览页面信息时分配浏览ID,验证码需要正确才能发表留言,提交留言后根据操作和内容进行后续的监控,并且留言过滤方法对于不需要实时过滤的留言先发表,对于过滤词敏感度较高的留言先发到后台,经过滤后发表,使得服务器负荷不大而且不遗漏垃圾留言。本发明可有效过滤网络留言系统中的垃圾留言,具有良好的效果和应用价值。

    一种搜索系统及其实现方法

    公开(公告)号:CN101957847B

    公开(公告)日:2011-11-23

    申请号:CN201010288740.1

    申请日:2010-09-21

    Abstract: 本发明提供一种搜索系统的实现方法,包括:接收用户的查询请求;从常规索引库搜索与查询请求相关联的常规在线应用搜索结果,并从个性化索引库搜索与用户的识别信息以及查询请求相关联的个性化在线应用搜索结果;对常规在线应用搜索结果以及个性化在线应用搜索结果进行合并,并根据在线应用的权威度属性及用户行为属性对在线应用进行排序后,发送合并后的常规在线应用搜索结果以及个性化在线应用搜索结果。本发明进一步提供一种搜索系统。通过上述方案,能够快速、有效地将用户定制的个性化搜索结果呈现于适当位置,以便于用户快速地定位到想要找的搜索结果。

Patent Agency Ranking